Biologie: van wet lab naar droge computer

lab

De studie van biologische processen heeft niet enkel in petriplaatjes en wet labs plaats. Meer en meer worden ook modelleermethoden gebruikt. Het sluit geen – dure en arbeidsintensieve - labo-experimenten uit, maar helpt wel om een deel van de processen te begrijpen en experimenten efficiënt te ontwerpen.

De essentie van thesissen in deze context zijn niet te vatten in een conclusie in één paragraaf. Het is echt timmeren aan de weg. Ellen Browaeys bestudeerde intercellulaire communicatie en modelleerde hoe een cel de genexpressie in naburige cellen kan reguleren. Chloë Guidi bestudeerde netwerken die de genregulatie voorstellen en bracht verbeteringen aan in een veel gebruikte techniek. Voor beide onderzoeken zijn de resultaten veelbelovend, maar is het werk zeker nog niet af.

 

Masterproef: Linking extracellular signals to target genes by dataintegration (confidentieel)

Auteur: Ellen Browaeys

Masterproef: Verbeteren van regulatorische netwerk inferentie gebaseerd op single-cell pseudotijd data

Auteu: Chloë Guidi 

Promotor: prof. Yvan Saeys

Masterproef: inleiding

Uit: Guidi, Chloë, et al. Verbeteren Van Regulatorische Netwerk Inferentie Gebaseerd Op Single-cell Pseudotijd Data. 2017.

Dankzij het tot expressie komen van verschillende genen, is een organisme er toe in staat om zichzelf aan te passen aan verschillende omgevingsaanpassingen. Er is echter een nood aan een mechanisme dat de het tot expressie komen van deze genen reguleert en er voor zorgt dat de juiste genen tot expressie komen op het juiste moment. Een voor de hand liggende naam voor dit mechanisme is dan ook genregulatie. Om een idee te hebben hoe genregulatie in werking treedt, wordt het voorgesteld als een netwerk waarin elke knoop een gen voorstelt en twee knopen verbonden zijn door een boog indien er een regulatorische link tussen deze genen is.

Gen regulatorische netwerken (GRN) vormen een belangrijk mechanisme in het evolutieproces van een complex biologisch systeem. Het begrijpen van dit mechanisme kan een inzicht geven in kanker fenotypes en leiden tot het bedenken van geschikte therapieën. Om die reden is er een nood aan methodes die deze onderliggende netwerken extraheren. Dankzij experimentele technieken zoals ChIP-chip en ChIP-seq is het mogelijk om informatie over interacties tussen de genen te verkrijgen. Desondanks zijn er heel wat tekortkomingen aan deze methodes zoals de kost om ze uit te voeren. Hierdoor zijn computationele technieken nodig die genregulatorische netwerken voorspellen.

De meeste reeds ontwikkelde methodes beginnen met genexpressiematrices, welke de expressiewaarden in biologische samples bevatten, die experimenteel verkregen zijn met technieken zoals RNA sequencing. Deze matrices bevatten vroeger de gemiddelde expressiewaarden in groepen van cellen, maar tegenwoordig zijn er nieuwe methodes ontwikkeld die de expressiewaarden in enkele cellen verkrijgen (sc-RNA seq).

De DREAM5 uitdaging zocht naar de meest betrouwbare netwerk inferentie methode die zijn tegenstanders overtroef gebaseerd op referentiedata. De winnaar van deze uitdaging was GENIE3 of Gene Network Inference based on Ensemble of Trees. Zoals de naam zelf al zegt, lost deze methode het probleem op door gebruik te maken van een ensemble of trees methode random forests. GENIE3 start met het opsplitsen van het probleem in p regressieproblemen indien de genexpressie matrix p genen bevat. Elk regressieprobleem wordt omgezet tot een random forests probleem waarbij ´e´en van de p genen de uitkomstvariabele is en de andere genen dienst doen als predictoren. Vanuit de geconstrueerde bomen berekent het algoritme een maat die aangeeft hoe belangrijk een predictor is in de voorspelling van het doelgen. Uiteindelijk wordt deze maat gebruikt om de links te ordenen waarbij de links die hoogst waarschijnlijk bestaan, bovenaan in de ordening staan.

Aangezien GENIE3 een hogere performantie had dan de andere deelnemers, zou het interessant zijn als er een mogelijkheid is om deze methode nog verder te verbeteren. Deze verbetering kan gevonden worden door het grote probleem aan te pakken dat de meeste huidige methodes bezitten. Bijna iedere bestaande methode voorspelt namelijk een statisch netwerk, waarbij verondersteld wordt dat dezelfde interacties de hele tijd actief of inactief blijven. Dit is echter niet realistisch omdat organismen moeten kunnen reageren op stimuli uit hun omgeving en hun gedrag bijgevolg moeten veranderen. Daarom hebben ze een dynamisch systeem nodig dat zichzelf kan aanpassen aan externe omstandigheden. Dit betekent dat methodes rekening zouden moeten houden met de dynamiciteit in het systeem tijdens het voorspellen van een netwerk. Een techniek die hiertoe van pas zal komen, is trajectinferentie. Startend van een genexpressiematrix geconstrueerd met sc-RNA seq, construeren deze methodes het differentiatiepad beginnend in cellen in een vroeg stadium en eindigend in cellen in een laat stadium. Om de informatie uit dit pad te reflecteren naar de data, wordt een numerieke waarde in arbitraire eenheid gekozen, die aangeeft waar elke cel zich bevindt op het pad. Aangezien deze waarde een indicatie geeft over de echte tijd waarin de cel zich bevindt, wordt deze numerieke waarde de pseudotijd genoemd.

Dankzij trajectinferentie is het dus mogelijk om de single-cell data uit te breiden met een extra vector die de pseudotijd voorstelt van de cellen. Nu deze data beschikbaar is, moeten nieuwe technieken ontwikkeld worden die de huidige methodes verbeteren door te steunen op de extra informatie.

 

Gerelateerde inhoud