Programme détaillé > Véronique Brunaud, GEM2Net : de l'expression des gènes vers les réseaux de gènes, un exemple d'application dans la réponse aux stress chez Arabidopsis thaliana

Bien que de nombreuses données génomiques, transcriptomiques et protéiques soient disponibles, l’inférence de fonction aux gènes est un processus encore compliqué.  Selon différentes estimations, 20 à 40 % des gènes d'eucaryotes dont le génome est complètement séquencé, n’ont aucune fonction attribuée.  Concernant la plante modèle Arabidopsis thaliana, 19% des gènes annotés reste totalement inconnue selon la dernière version de l’annotation officielle TAIR10. De ce fait, il devient important d'intégrer des ressources de données variées, les croiser et enrichir ainsi l'information liée aux gènes.  GEM2Net (Zaag et al. NAR 2015) est un exemple d'intégration de données omics, partant d’expériences d'expression de gènes chez Arabidopsis en condition de stress biotiques et abiotiques.

1- Extraction de données d'expression de 387 résultats de microarrays dans la base CATdb (http://tools.ips2.upsud.fr/CATdb).

2- Clusterisation par un modèle de mélange pour regrouper les gènes ayant des profils d'expression proches.

3- Annotation de ces groupes de gènes par intégration de ressources différentes : Gene Ontologie (GO),  Localisation subcellulaire des protéines, Interactions Prot-Prot, Annotations des Facteurs de transcription, Hormones interactions…

Ainsi, 681clusters de co-expression ont été obtenus dont 80% sont associés à un terme GO lié au stress. L'exploitation des données de co-expression de GEM2Net a permis de mettre en évidence l’existence de nombreux couples de gènes co-exprimés dans plusieurs catégories de stress allant jusqu’à 14 catégories. Cette approche permet de montrer un premier niveau d'organisation en réseau de gènes.

Personnes connectées : 1