Visualisering: Colourbox

Supercomputer besvarer spørgsmål om life science

Bioteknologi og biokemi
DTU-forskere bruger Danmarks største life science-supercomputer til at analysere komplekse datamængder og klæde lægerne på til at forbedre vores sundhed.

Med Danmarks største supercomputer specialdesignet til life science er det blevet lettere at analysere store mænger data om vores arvemasse og gøre behandlingen af den enkelte patient mere præcis. To nye projekter sigter mod at forbedre organtransplantation samt diagnosticere og behandle salmonella, listeria og klamydia med nye værktøjer.

Begge projekter er eScience-pilotprojekter fra DeIC (Danish e-Infrastructure Cooperation), der giver unge forskere mulighed for at arbejde med supercomputeren. Her trækker forskerne på en stor mængde data fra bl.a. danskernes arvemasse, elektroniske patientjournaler, røntgenbilleder og DNA-sekventering, der viser, hvordan organismers arvemateriale er opbygget.

”De sidste 50 år har vi registeret store mængder data om danskerne via deres cpr-numre. Det betyder, at der ligger en masse informationer, som vi kan kombinere med data om vores arvemasse. Alt det kan supercomputeren klare, ligesom den også kan køre op til 1.000 forskellige algoritmer,” siger Peter Løngreen, head of supercomputing på DTU Bioinformatik.

Leder efter nye proteiner

I det ene projekt arbejder DTU-studerende María Luisa Matey Hernández med at karakterisere en særlig region i det 6. kromosom, der kaldes HLA-regionen (human leukocyt antigen). HLA-systemet hjælper med at bekæmpe infektioner og er nøglen til en vellykket organtransplantation.

Hvert menneske har sin egen kombination af HLA-molekyler, og hvis der er for store forskelle mellem molekylerne hos patienten og i det nye organ, kan det blive udstødt.

Med projektet håber María Luisa Matey Hernández at finde nye typer proteiner, der er store molekyler, som findes i kroppen. Til det formål bruger hun supercomputeren, der indeholder data fra den nationale GenomeDenmark-platform, hvor 150 danskeres arvemasse er kortlagt.

”Målet er at undersøge, hvor gode de eksisterende metoder er til at fastslå danskernes HLA-type, men også at forsyne de eksisterende HLA-databaser med HLA-data fra GenomeDenmark. Hvis projektet lykkes, vil lægerne i fremtiden kunne udvælge netop de organer, der passer præcist til patienten,” siger María Luisa Matey Hernández.

Få skovlen under klamydia

I et andet projekt arbejder maskinlæringsekspert Peter Bork med at udvikle nye værktøjer til at diagnosticere og behandle sygdomsfremkaldende bakterier.

Som den første forsker på Institut for Bio- og Sundhedsinformatik anvender han to nye neurale netværk på supercomputeren, LSTM (Long Short Memory Networks) og CNN (Convolution Neural Network), der er baseret på matematik og algoritmer og efterligner mønstre i store datamængder.

De neurale netværk er med til at afsløre, hvilke proteiner bakterier som salmonella, klamydia og listeria sprøjter ind i andre celler for at inficere dem. Målet er at finde ud af, hvordan bakterierne angriber kroppen, og hvilke stoffer, de afgiver.

Netværkene bruges i kombination med maskinlæringsbiblioteket TensorFlow, som gør forskerne i stand til at køre data på tværs af flere hundrede computere på én gang.

Peter Bork håber på, at projektet vil bringe os tættere på at forstå, hvilken indflydelse biologien har på vores velbefindende:

”Hvis projektet lykkes, er vi kommet tættere på at få skovlen under klamydia, listeria og andre skadelige bakterier. For danskerne kan det betyde, at vi får en bedre behandling, og at den mad, vi spiser i fremtiden, indeholder færre skadelige bakterier.” 

Se mere på Youtube på kortlink.dk/n7em.

Video