Inuk, det første fortidsmenneske, som fik kortlagt hele sit genom, og en 24.000 år gammel dreng fra Sibirien, som viste sig at være beslægtet med Amerikas oprindelige befolkning, har det til fælles, at deres dna-koder har været igennem supercomputere på DTU.
Når man i øjeblikket gør opsigtsvækkende opdagelser om menneskets fortid, dybhavets hemmeligheder eller mikroorganismernes afgørende betydning for vores liv, skyldes det bl.a, at forskere inden for mange forskellige discipliner har fået adgang til en ny kilde af data, nemlig de informationer, som ligger indkodet i alle levende organismers dna. Sidste år var det 60-året for forskerne Watson og Cricks’ banebrydende beskrivelse af dna’et og dets dobbeltspiralstruktur, så dna er ikke en ny opdagelse. Men netop i disse år sker der en revolution i, hvad vi kan gøre med dna-teknologi, og hvilke slags oplysninger vi er i stand til at hente ud af en mikroskopisk informationskode, som i nogle tilfælde blev skrevet for tusinder af år siden.
En vigtig forudsætning for denne udvikling er en ny form for gensekventeringsmaskiner NGS (Next Generation Sequencing), som har betydet, at man kan sekventere et helt genom på få dage, og at prisen for at sekventere er styrtdykket. Konsekvensen er, at der i øjeblikket sprøjtes sekvensinformation ud, og at globale gendatabaser med offentligt tilgængelige dna-sekvenser vokser tilsvarende. Men sekventering alene gør det ikke. Inden for de seneste fem år er der sket store fremskridt med hensyn til, hvor lidt dna man behøver, og i hvilken kvalitet dna’et skal være, for at det er muligt at foretage en analyse. Desuden udvikles der hele tiden nye metoder til at analysere de data, som sekventeringsmaskinerne spytter ud.
700.000 år gammelt dna
I 2013 lykkes det forskere fra Center for GeoGenetik på Københavns Universitet at ekstrahere tilstrækkeligt dna fra en 700.000 år gammel knogle til at kortlægge det samlede genom for den fortidshest, som knoglen har tilhørt. At dette var muligt skyldtes en række fremskridt inden for metoderne til at analysere data. For når dna’et har været igennem sekventeringsmaskinerne og er blevet omskrevet til digitale koder bestående af kombinationer af bogstaverne ACGT, forestår der en omfattende opgave med at samle puslespillet, så man til sidst har den præcise rækkefølge af basepar, der udgør fortidshestens samlede genom. På Center for Biologisk Sekvensanalyse på DTU Systembiologi er man eksperter i at samle genomer, og det var her i DTU’s supercomputere, at opgaven med at samle de 12 milliarder små digitale dna-fragmenter til et komplet genom blev løst.
“At generere data er ikke længere noget problem,” forklarer professor Thomas P. Gilbert fra Center for GeoGenetik, KU, og fortsætter: ”Men at forstå, hvad de data betyder, og få noget fornuftigt ud af dem, det er den virkelig store udfordring. Sagen er, at der findes mange forskellige måder at analysere data på. Derfor skal man virkelig være ekspert for at kunne kende skidt fra kanel. Vi får derfor meget ud af at samarbejde med Center for Biologisk Sekvensanalyse på DTU. For ud over at have supercomputere, der kan jonglere med de datamængder, der her er tale om, har de ekspertisen til at gennemskue, hvilke nye metoder der virker, og de udvikler hele tiden nye metoder til at håndtere de problemer, vi står med.”
Frugtbart samarbejde
Professor Thomas Sicheritz-Pontén leder den sektion på DTU Systembiologi, som bl.a. har specialiseret sig i at samle genomer fra fossilt dna. Han fortæller:
”Gennem de seneste fem år har vi udviklet et effektivt samarbejde, der betyder, at dna-specialisterne i laboratorierne på Center for GeoGenetik og vores eksperter i dataanalyse på DTU faktisk er i tæt kontakt hele vejen gennem analyserne. Denne måde at arbejde på, hvor der også er plads til at udveksle idéer og erfaringer ud fra det, som vi hver især er specialister i, har givet nogle interessante resultater.” Det, han henviser til, er bl.a. en stribe af opsigtsvækkende forskningsresultater.
Første genom fra et fortidsmenneske
Det startede med dna-analysen af Inuk, en mand fra den nu uddøde Saqqaq-kultur, som levede i Grønland for omkring 4.000 år siden. Inuk kom på forsiden af Nature i februar 2010, da de danske forskere havde samlet verdens ældste menneskelige genom og ud fra dette genom havde et bud på, hvordan han havde set ud, samt hvilke sygdomme han havde været eksponeret for. En tot hår fundet i permafrosten i Grønland ved en udgravning 20 år tidligere var alt, hvad professor Eske Willerselv fra Center for GeoGenetik behøvede, for at få adgang til at sekventere et fortidsmenneskes dna.
Ramneek Gupta, professor ved Center for Biologisk Sekvensanalyse, DTU, var en af forskerne bag de efterfølgende analyser med supercomputere på DTU.
“At analysere Inuks dna var utrolig spændende, fordi vi ud fra sammenligninger af små variationer i hans gener kunne tegne et billede af, hvem dette fortidsmenneske var. Man er i dag nået rigtig langt m.h.t. at koble fysiske karakteristika til dna-profiler, og det er et område i rivende udvikling,” fortæller Ramneek Gupta.
Historiebøgerne skrives om
I november 2013 kom endnu et forskningsresultat, som gav genlyd i store dele af forskningsverdenen: kortlægningen af genomet fra en fireårig dreng, som havde levet ved Bajkalsøen i Sibirien for 24.000 år siden. Udgangspunktet var en knogle, som havde ligget i en montre på Eremitagemuseet i Skt. Petersborg, siden fundet af drengens fossile rester blev gjort tilbage i 1920. Men med de nye avancerede dna-teknologier kunne forskerne nu komme med en afsløring: Dna-analysen viste, at drengens nærmeste genetiske slægtninge var den indianske befolkning i Nord- og Sydamerika. Ergo må drengen fra Sibirien og indianerne have en fælles europæisk-vestasiatisk stamfader. Det har betydet, at man har ændret opfattelsen af, hvordan indvandringen til Amerika er foregået.
Dna fra et dybhavsmonster
Det er ikke kun i arbejdet med fossilt dna, at de nye fremskridt i dna-analyse skaber ny viden. Også inden for såkaldt metagenomanalyse sker der en udvikling. Metagenomanalyse er en kortlægning af mikroorganismernes dna i den menneskelige tarmflora.
“Vi begynder så småt at forstå, hvilken afgørende betydning mikroorganismer har for vores sundhed og for miljøet, og hvilket potentiale der ligger i den diversitet, som mikroorganismernes gener udgør. Metagenomanalyse gør det muligt for os at studere mikroorganismerne via den samlede pulje af deres dna,” fortæller Thomas Sicheritz-Pontén, som leder metagenomics-gruppen ved DTU Systembiologi, og fortsætter:
“Vi kører en række spændende projekter sammen med Center for GeoGenetik på Københavns Universitet, fordi centrets metoder til at generere data ud fra dna og vores kompetencer inden for analysen af disse data er et rigtig godt match.”
Projekterne omfatter bl.a. metagenomanalyser af enzymer i vin og mikroorganismer i gribbe og vampyrflagermus. Men der er særligt et projekt, som giver forskerne fra KU og DTU noget at slås med. Det er en dnaanalyse af kæmpeblæksprutten (Giant Squid – Architeuthis dux). Selvom dette monster fra dybhavet, der kan blive op til 12 meter langt, er en nulevende organisme, er den næsten lige så langt uden for rækkevidde som fortidsmennesker. I 2013 lykkedes det et japansk forskerhold at optage 23 minutters video af en kæmpeblæksprutte i dens naturlige miljø, men ellers er den eneste adgang, man har til kæmpeblæksprutterne, de rester, der en sjælden gang imellem skyller op på land eller ender i fiskeres net. Derfor er dna-analysen af sådanne rester en meget vigtig brik, hvis man vil vide mere om kæmpeblækspruttens fysiologi, adfærd og levevis.
“Det er interessant i sig selv at få mere viden om dette gådefulde væsen, som har eksisteret i fortællinger og myter gennem tiden, men ellers har levet fuldstændig i det skjulte. Men at samle kæmpeblækspruttens genom vil også være en forskningsmæssig bedrift, som kaster lys over mange overraskende forhold. Ingen har endnu kortlagt et helt genom for en blæksprutte. Og kæmpeblæksprutten har nogle meget interessante karakteristika og en speciel evolutionshistorie. Ud over dens kæmpe størrelse har den bl.a. også udviklet et meget avanceret øje, forklarer Thomas P. Gilbert.
Går efter det vanskelige
Projektet har dog vist sig at være langt vanskeligere end først antaget. Kæmpeblæksprutten har en høj koncentration af ammoniak i sit væv, som hjælper den med at afbalancere sig. Desværre gør det også dna-ekstraktionen vanskelig.
“Eske Willerslev og jeg har specialiseret os i at arbejde med virkelig svære ting,” bemærker Thomas P. Gilbert og fortsætter: “Kæmpeblæksprutten er virkelig udfordrende. Ikke kun fordi dna’et er skadet på forskellig vis, men også fordi det er så mærkelig en organisme. F.eks. er den polyploid, hvilket betyder, at dens dna er kopieret et ukendt antal gange. Og det giver store udfordringer, når man vil samle dens genom. Men vi skal nok nå i mål på et eller andet tidspunkt. Vi arbejder tæt sammen med DTU’s Center for Biologisk Sekvensanalyse om analysen. Centret har nemlig den computerkraft, der skal til for at arbejde med så mange forskellige datasæt. Ofte genererer vi mange typer data, og det at skulle sætte dem sammen er ikke så ligetil, for ét datasæt bruger én slags programmer, mens et andet bruger en anden slags. Så det kræver folk, der virkelig har forstand på at integrere data på meget avancerede måder,” forklarer Thomas P. Gilbert.
Interessante enzymer og nye teknologier
“Vi lærer meget, mens vi arbejder med kæmpeblækspruttens dna, fordi vi her bevæger os på kanten af nye teknologier. Da dette er et felt, som udvikler sig i rivende fart, kan vi ikke læne os tilbage og nøjes med at bruge de metoder, vi allerede har udviklet. I stedet er vi nødt til at være åbne og konstant skrive og afprøve nye programmer, der kan udvide vores muligheder for at ekstrahere viden fra data. Fordi dybhavet er så ekstremt et miljø og kæmpeblæksprutten en ekstrem organisme, forventer vi også opdagelser af nye, spændende enzymer, som er både forskningsmæssigt og industrielt relevante. F.eks. ved vi allerede nu, at kæmpeblæksprutten producerer et enzym, der er i stand til at nedbryde neurotoksiner a la den nervegas, som blev anvendt ved et terrorangreb i Tokyos metro i 1995. Blæksprutten er derfor ikke blot en spektakulær øvelse i ’genome assembly’, men også en vigtig del af vores strategi for ’enzyme discovery,’” slutter Thomas Sicheritz-Pontén.
Hør mere om dataanalyser og supercomputere i interviewet med institutdirektør og leder af Center for Biologisk Sekvensanalyse på DTU Systembiologi, professor Søren Brunak på www.dtu.dk/podcast-brunak