DECRYPTHON

Menu d'accès rapide :

« Décrypthon » l'appel aux internautes

Lors du Téléthon 2001, l’AFM et IBM lancent un appel à la mobilisation des internautes : « Mettez à la disposition de la recherche la puissance inutilisée de votre PC ». Objectif : réaliser la première cartographie du protéome: l'ensemble des protéines/molécules produite par les cellules.
Ce véritable défi scientifique, technologique et humain est alors relevé avec brio : 75 000 internautes mobilisés, des milliards de calculs complexes effectués, 550 000 protéines du monde vivant cartographiées. C’est une véritable bibliothèque de comparaison des protéines des différentes espèces du monde vivant (animal, végétal, humain). Elle contient près de 2,2 millions de fichiers répartis en 17 000 répertoires.

Tout cela en moins de deux mois, alors qu’il aurait fallu plus de 1170 années pour le réaliser à l’aide d’un seul ordinateur ! Chaque ordinateur a contribué à hauteur d’environ 133 heures, soit plus de 10 millions d’heures de calcul au total. 21 serveurs IBM ont hébergé l’ensemble des solutions et des données pendant toute la durée de l’opération.

Forte de ce succès, l’AFM a lancé courant 2003 un appel d’offres pour promouvoir l'utilisation de cette base de connaissances. Quatre projets ont été retenus:

  • Un projet a été proposé par deux équipes du Département des Sciences de la Vie du CEA de Saclay (S Zinn-Justin et R Guerois) en association avec A Poupon, du CNRS, laboratoire de génomique structurelle de la levure de l’université d’Orsay. Ce projet visait à étudier les relations entre la structure et les fonctions des protéines qui réduisent les risques d'anomalies génétiques chez l'homme et la levure.

    Puis trois équipes de l’IGBMC d’Illkirch, J Laporte et J-L Mandel, A Pujol et J-L Mandel, G Bey, F Sirockin, F Plevwniak et O Poch ont proposé trois projets de complexité croissante.

  • Un premier projet concernait l’identification et la caractérisation de protéines impliquées dans plusieurs maladies neuromusculaires, ainsi que la prédiction des domaines protéiques et des fonctions tissu-spécifiques.

  • Un deuxième projet a consisté à l’analyse des protéines d’un organite cellulaire, le peroxysome, qui est impliqué dans de nombreuses fonctions métaboliques essentielles.

  • Le troisième projet, à l’échelle d’un organisme, consistait à l’identification de nouvelles cibles thérapeutiques potentielles chez Vibrio cholerae et les organismes Diabac (Diarrhoeal Bacteria) impliquées dans les pathologies diarrhéiques

« Décrypthon » le projet d'une poignée d'acteurs passionnés

Deux projets on été sélectionnés en 2003/2004. Le but était de démontrer la faisabilité d'un programme disposant de sa propre grille de calcul avant de le mettre à la disposition de toutes les équipes, de mettre en place la grille, et d’en tester le fonctionnement. Ces deux projets ont été portés avec succès sur la grille et en bénéficient pour leurs calculs.

Projet de O. Poch, G. Deléage et coll (IGBMC/IBCP, Strasbourg/Lyon)

Equipe O. Poch.
L’objectif de ce projet est double : mettre au point une grille d’analyse descriptive des protéines avec des mutations connues, et élaborer un outil prédictif pour faciliter la compréhension de ces mutations dans les maladies humaines.

Ci-contre la photo de l’équipe impliquée à Strasbourg dans le projet MS2PH : de gauche à droite, Olivier Poch, Anne Friedrich, Luc Moulinier, et Raphaël Bolze, devant l’Institut de Génétique et de Biologie Moléculaire et Cellulaire (IGBMC) à Illkirch.
  
L’équipe Décrypthon s’est renforcée. Depuis février 2005, Hoan Nguyen a rejoint le groupe de Strasbourg afin de développer une base de données relationnelle permettant d’intégrer et d’interroger l’ensemble des connaissances accumulées.

Projet de C. Branlant, F. Leclerc, Y. Guermeur et coll (CNRS UMR 7503 et 7567/LORIA, Nancy)

Pour synthétiser une protéine, le gène (présent dans la molécule d’ADN) délivre dans la cellule un code de fabrication dans le cadre d’un processus qui a été baptisé : « épissage ».
Ce projet propose d’analyser les liens qui existent entre les défauts d’épissage et les maladies génétiques.
L’analyse des mutations dans les gènes chez des personnes atteintes de maladies génétiques et les conséquences de l’épissage devraient apporter des données fondamentales pour la compréhension de ces maladies. Cette étude devrait permettre le développement de thérapies basées sur la réparation de l’épissage impliquant, par exemple, le saut d’exon.
La première partie du projet a consisté à constituer une base de données des sites d’épissage des différents gènes humains. Le logiciel d’analyse des sites d’épissage a été réécrit pour être mis en œuvre sur la grille Decrypthon.
.
Ci-contre, la photo d'une partie de l’équipe du projet d’analyse de l’épissage alternatif : de gauche à droite, Yann Guermeur, Fabrice Leclerc, et Raphaël Bolze devant le Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA) à Nancy.

Raphaël Bolze, étudiant en thèse de Sciences à l’Ecole Normale Supérieure (ENS) de Lyon, réalise pour les deux équipes les applications des algorithmes sur la grille (gridification et portage).

« Décrypthon » le programme scientifique national

Devant le succès de ces deux projets, une convention est signée en mai 2004 entre l'AFM, le CNRS et IBM officialisant le projet alors nommé « Décrypthon basé » sur une grille de serveurs fournis gracieusement par IBM à 6 universités partenaires.

Au cours de cette période 6 nouveaux projets ont été réalisés ou sont toujours en cours:

  • Projet coordonné par Alessandra Carbone (Unité Inserm 511, Université Pierre et Marie Curie) Large scale investigation of protein-protein, protein-DNA and protein-ligand interactions leading to drug targeting. Ce projet s'attache à mettre au point des outils informatiques pour repérer à la surface des protéines des sites d'interactions avec d’autres protéines, de l'ADN ou des ligands.

  • Projet de Christophe Pouzat et Pascal Viot (CNRS UMR 8118, Université René Descartes, Paris V) Parallélisation d'une méthode de Monte Carlo pour le tri des potentiels d'action : amélioration d'un outil pour la recherche fondamentale en neurosciences et le diagnostique des maladies neuromusculaires. Ce projet vise à automatiser le traitement des signaux de l'activité neronale enregistrés par les médecins pour déceler les dysfonctionnements éventuels des neurones dans le cerveau ou des motoneurones qui commandent les fibres musculaires.

  • Projet coordonné par Marc Robinson-Rechavi (Faculté de Biologie et de Médecine de l’université de Lausanne / ENS Lyon)
    Datamining de transcriptomes animaux pour annoter les processus neuromusculaires du génome humain. Ce projet permettra d’identifier précisément quels sont les gènes qui devraient s’exprimer (ou qui s’expriment à tort) dans les cellules musculaires, des informations capitales pour comprendre les maladies neuromusculaires.

  • Projet coordonné par E-K. Talbi (LIFL – Laboratoire d’Informatique Fondamentale de Lille, USTL, CNRS, INRIA, Villeneuve d’Ascq)
    Conformational sampling and docking on Grids: Application to neuromuscular diseases. Le but est de prédire, par calcul, la nature et le type des liaisons des molécules intervenant  dans le fonctionnement de la cellule normale, et de développer la recherche « in silico » (par calcul) des moyens d’interférer avec les processus physiologiques normaux ou pathologiques – et donc de développer de façon rationnelle des médicaments.

  • Projet coordonné par F. Relaix et O. Poch (Institut de Myologie, Paris – IGBMC, Illkirch)
    Large-scale identification of transcriptional networks during myogenesis. Ce projet a pour but d’identifier les mécanismes de transcription moléculaire dans l'évolution du muscle.

  • Projet coordonné par M. Robinson-Rechavi et L. Schaeffer (Faculté de Biologie et de Médecine de l’université de Lausanne / ENS Lyon)
    Intégration d'approches multiples de génomique fonctionnelle pour comprendre le muscle.

« Décrypthon » le programme scientifique international

En 2007, le projet de l'équipe d'Alessandra Carbone lance sa phase préparatoire sur la grille de calcul mondiale et publique  World Community Grid en calculant les interactions de 336 protéines. Il est alors connu sous le nom public "Help Cure Muscular Dystrophy" (HCMD).
En 2009, aprés l'exploitation de l'expérience de la première phase, la deuxième étape du projet est lancée sur World Community Grid. Ce sont 150 000 internautes qui sont appelé pendant une année entière à se consacrer à l'achèvement de ce projet gigantesque.

> Voir les publications.