Programme détaillé > Olivier Poch, Complex Systems and Translational Bioinformatic, Strasbourg Des Big Data à la relation génotype-phénotype. Application aux ciliopathies.

Olivier Poch, Directeur Equipe CSTB (Complex Systems and Translational Bioinformatics)

Le flux actuel de données biomédicales ouvre des possibilités considérables, mais pose également de nouveaux défis, comme le souligne l’initiative Big Data to Knowledge1 du NIH. Il s’agit notamment, d’intégrer des données hétérogènes de grandes dimensions, de les représenter et d’en extraire de la connaissance, notamment pour améliorer le dépistage et le traitement personnalisé des maladies. Dans ce cadre, en collaboration étroite avec une équipe de cliniciens disposant de données patients (exomes, phénotypes détaillés standardisés), un des objectifs du CSTB (http://icube-cstb.unistra.fr) est de développer des méthodes de profilage «omique» des 20000 gènes humains sous l’angle des ciliopathies afin de caractériser les relations génotypes/phénotypes. Les ciliopathies2 recouvrent de nombreuses maladies génétiques dont les syndromes de Bardet-Biedl, de Joubert, d’Alström… Elles impliquent une atteinte du cil, organelle essentielle de nombreux processus cellulaires (division, signalisation, détection de l’environnement…). Les symptômes peuvent découler de tissus/organes spécialisés autour du cil (rétine, rein…) ou être plus généraux (obésité, diabète). Le large éventail de symptômes observés (plusieurs dizaines) et les différences phénotypiques marquées entre ciliopathies font de ces maladies génétiques rares un modèle de choix pour l’étude du lien entre gènes et phénotypes.

Pour étudier ces liens, nous avons effectué un « profilage » des gènes humains sur la base des bilans de présence/absence des gènes orthologues entre espèces ciliées et non-ciliées. Différentes méthodes de classification des profils ont été comparés afin d’établir un protocole optimisé permettant de caractériser les gènes ciliaires connus et de prédire des gènes ciliaires inconnus dont certains ont été validés expérimentalement.

Dans un second temps, nous avons constitué une base de connaissances orientée cil centrée sur les gènes humains et s’appuyant sur des protocoles automatiques de collecte et mise à jour de données ciliaires publiques : génomiques (isoformes/variants), «omiques» (expression, interaction…) et bibliographiques (liens aux ciliopathies et phénotypes associés). Ces données publiques ont été complétées par les données générées in silico : signaux de régulation de la transcription spécifiques du cil, signaux de localisation ciliaire, profils évolutionnaires entre organismes ciliés et non ciliés (présence/absence d’orthologues). Pour chaque gène, l’ensemble des informations constitue un méta-profil dont la représentation est formalisée et standardisée dans le cadre de graphes analysés dans le contexte de Cytoscape. Les modules statistiquement enrichis en gènes ciliaires connus ou inconnus sont étiquetés selon divers critères afin d’établir des gènes cibles priorisés pour une validation expérimentale de leur implication dans le cil. Enfin, ces approches ont été utilisées pour l’analyse automatisée des données de séquençage d’exomes de patients afin d’identifier de nouveaux gènes responsables de ciliopathies.

A terme, les méthodologies de profilage et l’infrastructure développées ont vocation à être adaptées à d’autres maladies génétiques.

Personnes connectées : 1