Des outils mathématiques et informatiques au service de l’étude de la biodiversité amazonienne

Au sein du CEBA, des travaux de recherche sont en cours afin de mettre à disposition des chercheurs un ensemble d’outils mathématiques et informatiques facilitant le traitement des données biologiques. Un groupe de travail en mathématiques et informatiques appliquées à la biodiversité (MIAB) s’est constitué pour répondre à ces besoins croissants, notamment dans le cadre du projet ‘Virtual Biodiversity Lab’ développé et soutenu par le CEBA.
Ceci devrait faire progresser plus rapidement les connaissances sur la biodiversité amazonienne.
Mettre des outils informatiques à disposition de la communauté du CEBA, principalement au service de l’écologie et de l’épidémiologie, puis les faire évoluer progressivement en fonction des besoins des scientifiques. C’est l’objectif de la démarche adoptée par l‘équipe composée de quatre chercheurs et ingénieurs du laboratoire Biogeco et membres du CEBA : Alain Franc (coordinateur), Philippe Chaumeil, Jean-Marc Frigerio et Yec’han Laizet.
L’équipe met au point plusieurs outils :
– des bases de données : une base a par exemple été réalisée sur les arbres de Guyane, en collaboration avec Daniel Sabatier et Jean-François Molino, chercheurs au laboratoire Amap, auquel est rattaché l’herbier de Cayenne, et Henri Caron (Ecofog), tous membres du CEBA. Elle a été diffusée auprès des membres du CEBA et est accessible sur le site Internet du Réseau de Systématique intitulé R-Syst1. Cette base de données peut être interrogée afin d’identifier un individu par sa séquence d’ADN.
– des applications qui traitent des grandes masses de données telles que des séquences d’ADN. En combinant les applications Disseq (calcul de distances) et Declic (visualisation) par exemple, l’utilisateur peut vérifier si la structure hiérarchique de la diversité proposée par la taxonomie se retrouve dans les distances entre séquences d’ADN. Le résultat du calcul se présente par exemple sous forme d’un graphique en MDS (Multidimensional Scaling) comportant des ensembles de points d’une même couleur, correspondant à des taxa proches en termes de phylogénie. Notons que Disseq est l’une des trois applications pilotes qui ont été déployées dans le cadre de la plateforme E-Biothon2, récemment inaugurée.

DeclicBiogeco

Capture d’écran – résultat du calcul effectué par l’application Déclic sur 1000 individus d’arbres de Guyane aboutissant au positionnement de dix familles. On note un mélange de structures continues et en clusters.
© Alain Franc & al. – Biogeco

Pour faciliter l’utilisation des outils, le groupe de chercheurs propose un environnement de travail informatique partagé et adaptable en fonction des besoins, via un simple portail web. Ces outils réalisés dans le cadre du projet ‘Virtual Biodiversity Lab’ sont disponibles sur le serveur Galaxy3 déjà utilisé par la plateforme Génome Transcriptome de Bordeaux (PGTB). Ce serveur propose des outils standard, ainsi que ceux spécifiquement élaborés par le groupe de travail MIAB et par la PGTB.
L’accès en ligne est simple et pratique : nul besoin de solliciter la mémoire vive et la puissance de traitement de son ordinateur. Pour ce qui est des données NGS (Next-generation sequencing), leur traitement nécessite l’utilisation de moyens de calcul intensif, qui ne sont disponibles ni dans les laboratoires, ni sur le serveur Galaxy. Yec’han Laizet travaille actuellement pour mettre en place des passerelles vers des plateformes informatiques de haute capacité. L’objectif est que le traitement des données soit transparent pour l’utilisateur : celui-ci accède à l’outil sans se soucier des processus informatiques complexes qui se cachent derrière.
La plateforme évolue grâce aux utilisateurs qui font remonter leurs besoins concernant les logiciels auprès de l’équipe MIAB. Celle-ci développe ensuite des applications spécifiques.
 
Ainsi, les membres du CEBA ont la possibilité de caractériser plus rapidement et de manière plus fiable la biodiversité guyanaise. Ceci s’applique en écologie dans l’étude des plantes, champignons et amphibiens par exemple, mais aussi en épidémiologie afin d’identifier les virus présents chez certaines espèces ainsi que les espèces qui jouent le rôle de vecteurs dans la transmission d’une maladie.
Le groupe de travail MIAB est venu présenter ses travaux à plusieurs reprises auprès des équipes du CEBA, lors de missions spécifiques en Guyane et à l’occasion des réunions annuelles du réseau en 2012 et 2013. Les chercheurs qui travaillent sur la taxonomie moléculaire ont fait part de retours positifs et utilisent d’ores et déjà les outils proposés, qui ont vocation à se diversifier.
———-
Contact :
Alain Franc, coordinateur du groupe de travail MIAB.
alain.franc@pierroton.inra.fr, 05 57 12 28 13
 
Liens utiles :
1. R-Syst : http://www.rsyst.inra.fr/fr/content/le-r%C3%A9seau (À noter : les données sont en accès libre dès aujourd’hui.)
2. Communiqué de presse E-biothon : http://www2.cnrs.fr/presse/communique/3313.htm
3. Serveur Galaxy : https://galaxy-pgtp.pierroton.inra.fr/