Search
Generic filters
Exact matches only
Search in title
Search in content
Search in excerpt
Filter by Categories
Actualités
Uncategorized

      Noeud français d'ELIXIR

      L'IFB est le noeud français de l’infrastructure européenne de bioinformatique ELIXIR, soit ELIXIR-FR. L’IFB-core, en tant que noeud national de l’IFB, est en relation avec le hub européen d’ELIXIR à Hinxton. Organisation intergouvernementale qui développe une infrastructure Européenne distribuée, ELIXIR permet aux scientifiques dans le domaine des sciences de la vie d’accéder à des ressources telles que des bases de données, des outils logiciels, du matériel de formation, du stockage cloud et des clusters de calcul. Les expériences en Science de la vie génèrent un volume de données et un nombre de logiciels immenses et en augmentation exponentielle. Il est nécessaire de stocker les données, de les rendre accessibles, interopérables et sûres. L’objectif d’ELIXIR est de coordonner ces ressources pour former une infrastructure unique permettant aux scientifiques de trouver et de partager des données, d’échanger des compétences et de convenir des meilleures pratiques dans toute l’Europe.

      ELIXIR-FR

      La mission d'ELIXIR-FR est de doter la communauté bioinformatique française d'outils et d'expertise afin d'améliorer son offre de services auprès des chercheurs. ELIXIR-FR assure la pérennité des ressources bioinformatiques nationales, participe au développement d'une infrastructure durable de stockage, de traitement et d'analyse des données des sciences de la vie et donne accès à des outils et formations pour faciliter ces activités.

      ELIXIR-FR contribue aux activités des plateformes et des communautés d’ELIXIR en s’assurant que les ressources bioinformatiques développées par la communauté française s’intègrent dans l’offre de service Européenne.

      > Coordination des activités de ELIXIR-FR 

      Direction du noeud : Claudine Médigue and Jacques van Helden
      Chef adjoint du noeud:  Anne-Françoise Adam-Blondon
      Coordinateurs techniques : Christophe Blanchet; Olivier Collin
      Coordinateur de formation : Olivier Sand

      Réalisations clés d’ELIXIR-FR

       

      • Orphadata, la plateforme de mise à disposition des données d'Orphanet, la base de connaissances des maladies rares, a été labellisé Core Data Resource par ELIXIR en 2019
      • ELIXIR-FR a eu un rôle très actif via la communauté ELIXIR « Plant Sciences » qu’elle co-anime, dans la coordination des activités d’ELIXIR avec l’infrastructure européenne de phénotypage chez les plantes EMPHASIS
      • Le nœud français a été très actifs dans le recueil des besoins des utilisateurs en terme d’outils, leur déploiement dans des environnements adaptés tels que Galaxy, et l’organisation de formations, hackathons et workshops en lien avec ces besoins (ex : workshop « Bio.tools, Biocontainers and Galaxy »). ELIXIR-FR a ainsi développé des pipelines d’analyse pour les communautés ELIXIR « Proteomics » (Proline) et « Metabolomics » (Workflow4Metabolomics) et co-anime la communauté Galaxy.

       

      ELIXIR-FR a organisé le premier BioHackathon ELIXIR à Paris en 2018

      Services ELIXIR-FR

      Les services d’ELIXIR-FR comprennent des bases de données, des outils, des infrastructures informatiques et des services de formation qui sont importants pour la communauté française travaillant dans le domaine de la bioinformatique pour les sciences de la vie. De plus, ces outils doivent être alignés sur les recommandations de bonnes pratiques des plateformes d’ELIXIR, dans une dynamique de science ouverte et raisonnablement durable.

       

      • ANISSED est la principale base de données d'organismes modèles pour la communauté mondiale des scientifiques travaillant sur une classe d'invertébrés marins, les tuniciers (groupe sœur des vertébrés). Elle intègre pour chaque espèce : une base de connaissances principale avec des informations étendues sur la fonction des gènes, l'expression des gènes, la phylogénie et l'anatomie embryonnaire à une résolution cellulaire unique ; un navigateur de génomique et un navigateur de synthèse de gènes Genomicus.
        Patrick Lemaire & Christelle Dantec
        Bio.tools link 

       

      • ARIA (Ambiguous Restraints for Iterative Assignment) est un logiciel pour l'attribution automatique des NOEs et le calcul de la structure de la RMN. Il accélère et automatise le processus d'attribution grâce à un protocole itératif.  
        Benjamin Bardiaux & Michael Nilges
        Bio.tools link

       

      • AuReMe est un espace de travail adaptable pour des reconstructions ou des améliorations durables de modèles métaboliques à l'échelle du génome impliquant des pipelines personnalisés. Il est adapté à l'étude métabolique d'organismes et de microbiomes non conventionnels afin de garantir que le processus est reproductible et documenté quelle que soit la combinaison d'outils utilisée. Parmi les modules inclus dans l'environnement AuReMe, on trouve notamment un module de gestion de modèle PADmet, un module d'exportation wiki, un outil de comblement de lacunes pour les organismes non conventionnels (meneco), un outil de réduction des communautés microbiennes basé sur les complémentarités métaboliques (miscoto) et un progiciel permettant de gérer l'analyse du microbiote à grande échelle (Metage2Metabo).
        Anne Siegel & Jeanne Got
        Bio.tools link

       

      • BISE/BIII  Le BIII Bio Image informatics Index (www.biii.eu) est une base de données de connaissances sur les outils logiciels, les bases de données d'images de test et le matériel de formation pour l'analyse des bio-images. Les outils logiciels sont organisés sous forme de protocole d'analyse complet (workflow), de brique spécifique (composant) pour construire un workflow, ou de plate-forme logicielle ou de bibliothèque (collection).  Ils sont décrits en utilisant Edam Bio Imaging, qui est défini de manière itérative à l'aide de ce site web. Toutes les entrées sont exposées selon les principes FAIR et sont accessibles pour d'autres usages avec la licence (ODC-By) v1.0.
        Perrine Paul-Gilloteaux
        Bio.tools link

       

      • CRISPRCas ++  est un nouveau site web contenant un programme appelé CRISPRCasFinder pour détecter les éléments CRISPR et les gènes cas dans le génome des procaryotes. CRISPRCasMeta est adapté à l'analyse de grandes données de métagénomique. Les programmes sont disponibles en ligne ou peuvent être téléchargés pour un usage local. Une base de données appelée CRISPRCasdb, le successeur de CRISPRdb, est accessible sur le site web de CRISPRCas++. Elle peut être parcourue et interrogée à la recherche de séquences répétées et d'espaceurs. 
        Christine POURCEL
        Bio.tools link

       

      • FAIDARE est un portail développé par ELIXIR-FR au service de la communauté des sciences végétales ELIXIR. FAIDARE permet la découverte de données sur les plantes réparties dans des fédérations de systèmes d'information distants qui ont mis en place une API standardisée, la BrAPI. FAIDARE permet actuellement de faire des recherches sur des données d'accessions de ressources génétiques, de phénotypage et de génotypage.
        Anne-Françoise Adam-Blondon
        Bio.tools link

       

      • GenomeHubs Le South Green Genome Hub est un ensemble de portails communautaires spécifiques aux cultures qui permettent de gérer les ensembles de données génomiques en mettant l'accent sur les plantes tropicales et méditerranéennes. Actuellement développés sur la banane, le manioc, le cacao, le café, l'herbe, le riz et la canne à sucre, les hubs génomiques donnent accès à de multiples ensembles de données (par exemple, des assemblages, des informations sur les produits géniques, les voies métaboliques, les familles de gènes, la transcriptomique et les marqueurs génétiques).
        Gaetan Droc
        Bio.tools link

       

      • GENOMICUS Genomicus est une base de données qui intègre des données de génomes modernes et ancestraux (reconstruits algorithmiquement) dans un objectif de génomique comparative. Cette base de données est navigable via une interface web intuitive. Ce serveur permet aux utilisateurs de naviguer dans les génomes en plusieurs dimensions: linéairement le long des chromosomes, transversalement à travers les différentes espèces, et chronologiquement selon un axe évolutif. Une interface graphique conviviale permet des comparaisons de conservations de synténie et d'ordre de gènes entre paire de génomes ou de multiples génomes à différentes échelles: selon l'ordre local des gènes sur les chromosomes, par comparaison de caryotypes, grâce à des représentations de matrice de conservation entre génome, etc. Différents phylums tels que celui des vertébrés, des plantes, des champignons, ou des métazoaires non vertébrés (selon Ensembl et  Ensembl Genomes) sont représentés et régulièrement mis à jour (selon les release des bases de données Ensembl et  Ensembl Genomes), ainsi que des versions spécifiques pour des analyses sur les tunicés, les poissons téléostéens ou encore Amphioxus. 
        Alexandra Louis
        Bio.tools link

       

      • GINsim est un système d'information modulaire et interopérable pour les plantes (cultures et forêts) et les champignons phytopathogènes de l’INRAE et de ses partenaires. GnpIS facilite l'intégration des données génomiques (principalement des annotations du génome et des polymorphismes), génétiques (QTLs, GWAS) et phénotypiques. Il est utilisé comme dépôt central du Consortium international pour la séquence du génome du blé.
        Denis THIEFFRY
        Bio.tools link

       

      • GnpIS est un système d'information modulaire et interopérable pour les plantes (cultures et forêts) et les champignons phytopathogènes. GnpIS facilite l'intégration des données génomiques (principalement les annotations du génome, les polymorphismes et la synthèse), génétiques (QTLs, GWAS) et phénotypiques. Il est utilisé comme dépôt central du Consortium international pour la séquence du génome du blé.
        Anne-Françoise Adam-Blondon
        Bio.tools link

       

      • IMGT the international ImMunoGeneTics information system®, est une ressource de connaissances intégrée spécialisée dans les immunoglobulines (IG) ou anticorps, les récepteurs des lymphocytes T (TR) et l'histocompatibilité majeure (MH) des espèces de vertébrés humaines et autres, ainsi que dans la superfamille des immunoglobulines (IgSF), la superfamille des MH (MhSF) et les protéines apparentées du système immunitaire (RPI) des vertébrés et des invertébrés. IMGT® fournit un accès commun aux données d'immunogénétique de séquence, de génome et de structure, basé sur les concepts d'IMGT-ONTOLOGIE et sur les règles du tableau scientifique IMGT.
        Sofia Kossida
        Bio.tools link

       

      • Life map est un outil web et une application pour mobiles permettant d'explorer l'arbre de la vie, c'est à dire les liens évolutifs entre toutes les espèces du monde vivant. La visualisation est inspirée des outils de cartographie actuels : l'exploration se fait en zoomant dans l'image et en s'y déplaçant. Cliquer sur les nœuds et les feuilles de l'arbre permet d'avoir accès à la fiche Wikipédia correspondante, qui inclue éventuellement une photographie. Lifemap permet aussi de calculer des 'routes' ou des 'itinéraires' dans l'arbre de la vie pour y repérer l'ancêtre commun le plus récent de deux taxons, ou de visualiser et de télécharger des sous-arbres pour à un ensemble de taxons renseignés par l'utilisateur. Lifemap existe dans plusieurs versions et dans plusieurs langues.
        Damien de Vienne
        Bio.tools link

       

      • LoRDEC est un logiciel autonome pour la correction d'erreurs de longues lectures (de Pacific Biosciences, ou Oxford Nanopore) avec une approche hybride. LoRDEC utilise des lectures courtes pour corriger des lectures longues ; il combine des données de séquençage provenant des technologies de deuxième et troisième générations. Il peut être facilement intégré dans n'importe quel pipeline pour traiter des données de séquençage profond. L'originalité de LoRDEC est de construire un graphe qui résume toutes les lectures courtes, puis d'aligner les lectures longues sur ce graphe pour les corriger. Cela fait du LoRDEC un outil très efficace pour traiter de grands ensembles de données. Il a été largement utilisé dans le monde entier dans le cadre de projets (plus d'une centaine) portant sur l'ensemble du génome ou du transcriptome.
        Eric RIVALS
        Bio.tools link

       

      • MATRIXDB est une base de données centrée sur les interactions moléculaires des protéines de la matrice extracellulaire et des glycosaminoglycanes (GAGs). L'interface d'interrogation avancée permet aux utilisateurs de parcourir les données de MatrixDB, de construire et de visualiser des réseaux d'interaction spécifiques basés sur des données transcriptomiques ou protéomiques quantitatives, des pathologies, des processus biologiques ou des fonctions moléculaires. MatrixDB héberge l'outil de construction GAG Builder permettant de construire en ligne des modèles 3D de séquences GAG se liant à des protéines. Sylvie RICARD-BLUM
        Bio.tools link

       

      • MetExplore est un serveur web gratuit et ouvert pour l'analyse des données omiques dans le contexte des réseaux métaboliques à l'échelle du génome. MetExplore permet notamment l'annotation collaborative des réseaux métaboliques. Dans le cas spécifique de la métabolomique, il fournit des algorithmes exploitant la structure du réseau métabolique tel que MetaboRank, un système de recommandation pour améliorer la constitution d'empreintes métaboliques. Une des originalités de Metexplore réside dans sa capacité à permettre une visualisation personnalisée des réseaux métaboliques à l'aide d'une bibliothèque javascript open source : MetExploreViz.
        Fabien JOURDAN
        Bio.tools link

       

      • Microscope est une plateforme Web intégrée pour l'annotation et l'exploration des fonctions des gènes des microorganismes au travers d'analyses comparées des génomes, pangénomes et du métabolisme. La plateforme prend en charge la soumission de génomes et de métagénomes nouvellement assemblés et fournit également des services d'analyse de données RNA-seq. L'interface utilisateur de MicroScope permet un travail collaboratif dans un contexte comparatif riche afin d'améliorer les efforts de curation communautaire.
        Claudine Médigue, David Vallenet
        Bio.tools link

       

      • Norine est la seule ressource consacrée aux peptides non ribosomiques (PNR). Elle contient une base de données complétée par des outils d'analyse (comparaison des structures, inférence de la structure des monomères à partir de la structure chimique, analyse du spectre de masse, annotation des PNR pour soumission à la base de données). Les PNR sont des métabolites secondaires produits par des bactéries et des champignons et présentent un spectre diversifié d'activité biologique.
        Pupin Maude, Leclère Valérie, Flissi Areski
        Bio.tools link

       

      • Ocean Gene Atlas Le service Ocean Gene Atlas permet d'accéder à trois objets de données complémentaires : les catalogues de séquences de gènes (ENA), le contexte environnemental des échantillons (PANGAEA) et les estimations de l'abondance des gènes dans les échantillons (calculées par la cartographie des séquences brutes lues sur les catalogues de gènes). Les requêtes de l'utilisateur sont composées soit d'une séquence (nucléique ou protéique), soit d'un modèle de Markov caché dérivé d'un alignement de séquences multiples. Les homologies de la requête utilisateur dans les catalogues de gènes sont identifiées à l'aide d'outils de recherche de similarité de séquence standard (par exemple BLAST ou HMMER), et leur abondance estimée basée sur la lecture est affichée sur des cartes du monde interactives et des parcelles écologiques. Un arbre phylogénétique est également déduit afin de situer la requête de l'utilisateur dans son contexte d'homologues du milieu marin ainsi que d'homologues connus à partir de séquences de référence.
        Magali Lescot
        Bio.tools link

       

      • Orphadata fournit à la communauté scientifique des ensembles de données complets et de qualité sur les maladies rares à partir de la base de connaissances Orphanet, dans des formats réutilisables, y compris un point final SPARQL.
        Ana Rath & Marc Hanauer
        Bio.tools link

       

      • Orphanet est la ressource de référence pour les informations sur les maladies rares et les médicaments orphelins. Orphanet fournit également des métadonnées sur les ressources pertinentes, notamment les registres et les biobanques de maladies rares, les projets de recherche, les essais cliniques, les centres d'experts et les tests de diagnostic pour plus de 30 pays. Orphanet tire de sa base de connaissances une ontologie des maladies rares, des informations sur les maladies rares et des données sur les maladies rares.
        Ana Rath
        Bio.tools link

       

      • ParameciumDB est une base de données communautaire sur l'organisme modèle Paramecium. Le site web donne accès aux génomes de nombreuses espèces de paramécies ainsi qu'à leurs annotations. ParameciumDB intègre également des jeux de données de séquencage (DNA-seq, RNA-seq, ChIP-seq) fournis par la communauté. Ce portail permet d'interroger, d'extraire, de visualiser et de comparer les données publiques les plus récentes.
        Olivier ARNAIZ
        Bio.tools link

       

      • Phylogeny.fr  est un serveur web destiné aux analyses phylogénétiques, conçu pour permettre à des utilisateurs non spécialistes ou experts d'exécuter des pipelines phylogénétiques. Ces pipelines enchaînent automatiquement des programmes pour effectuer différentes tâches : l'identification des séquences homologues, leur alignement multiple, le nettoyage des sites de l'alignement, la reconstruction phylogénétique et la représentation graphique de l'arbre inféré.
        Olivier Gascuel, Jean-Michel Claverie, Vincent Lefort
        Bio.tools link

       

      • PhyML est un logiciel qui estime les phylogénies de vraisemblance maximale à partir d'alignements de séquences de nucléotides ou d'acides aminés. La principale force de PhyML réside dans le grand nombre de modèles de substitution couplés à des algorithmes efficaces pour rechercher dans l'espace des topologies des arbres phylogénétiques. PhyML a été conçu pour traiter des ensembles de données de taille moyenne à grande. En théorie, il est ainsi possible d'analyser des alignements comportant jusqu'à 4 000 séquences de 2 000 000 de caractères. PhyML prend en compte des ensembles de données constitués de plusieurs gènes et ajuste des modèles de substitution sophistiqués avec des composantes hétérogènes à travers les différents éléments d'une partition de génome.
        Stéphane Guindon
        Bio.tools link

       

      • REPET intègre des pipelines bioinformatiques dédiés à la détection, l'annotation et l'analyse des éléments transposables (TE) dans les séquences de génomes. Les principaux pipelines sont (i) TEdenovo, qui recherche des répétitions, construit des séquences consensuelles de TE et les classe en fonction de leurs caractéristiques, et (ii) TEannot, qui exploite un génome avec une bibliothèque de séquences TE, par exemple celle produite par le pipeline TEdenovo, pour fournir des annotations TE exportées dans des fichiers GFF3.
        Hadi Quesneville
        Bio.tools link

       

      • RSAT Regulatory Sequence Analysis Tools est une suite logicielle spécialisée pour la détection de régions cis-régulatrices dans les séquences génomiques non codantes. Elle comprend des outils pour extraire les séquences, découvrir des motifs, comparer et clusteriser ces motifs, visualiser les sites de fixation de facteurs de transcription, générer des jeux de données servant de contrôles négatifs, et d'autres utilitaires. Les outils sont accessibles via un site web (http:rsat.eu/), via des services web REST, ou installés localement sur les systèmes Linux / Mac OS X.
        Jacques van Helden, Morgane Thomas-Chollier, Alejandra Medina Rivera
        Bio.tools link

       

      • SulfAtlas est une base de données basée sur la connaissance qui (i) aide à mieux annoter les sulfatases dans les données (méta)génomiques et notamment à améliorer la prédiction des spécificités des substrats ; (ii) guide les biologistes expérimentaux dans la sélection des sulfatases cibles qui restent à caractériser en termes de fonction et de structure. Les données contenues dans SulfAtlas sont conservées par des experts, sur la base de notre système de classification basé sur la phylogénie et de la littérature.
        Gurvan MICHEL
        Bio.tools link

       

      • VarAFT est un logiciel conçu pour annoter et filtrer les données des ENG humaines. Ce système a été développé dans le cadre du projet RD-Connect et a joué un rôle déterminant dans la création de la plateforme génomique et phénologique RD-Connect. En tant que système java autonome, il assure une protection totale des données, essentielle pour une utilisation clinique. VarAFT fournit la qualité des expériences, les annotations et permet le filtrage des fichiers VCF. Les données de plusieurs échantillons peuvent être combinées pour traiter différents troubles héréditaires mendéliens, la génétique des populations ou les cancers. Il contient des caractéristiques uniques de priorisation des variantes, notamment OMIM, HPO, l'ontologie des gènes, les voies et les prédictions de UMD-Predictor et Human Splicing Finder, en plus des annotations classiques de dbNSFP . Il est utilisé par de nombreux laboratoires de recherche et cliniques dans le monde entier.
        Christophe Béroud
        Bio.tools link

       

      • WheatIS est un portail au service de l’initiative international sur le blé (www.wheatinitiative.org) qui permet la découverte de données de génétique et de génomique du blé réparties dans une fédération internationale de systèmes d'information distants.  Le portail WheatIS permet la découverte par mot-clé de tout type de données. Il offre actuellement un point d'entrée unique aux données fournies par une douzaine d’instituts mondiaux.
        Anne-Françoise Adam-Blondon
        Bio.tools link

       

      • Workflow4Métabolomics est basé sur l'environnement Galaxy qui fournit des interfaces conviviales pour construire, exécuter et partager des flux de travail complets d'analyse de données et donne accès à un environnement de calcul haute performance : l'infrastructure ELIXIR-FR/IFB. Ainsi, le W4M offre plus de 40 outils pour traiter les données provenant des trois principales technologies (RMN, GCMS, LCMS), y compris des algorithmes uniques développés par les développeurs du W4M eux-mêmes. Les données et les flux de travail peuvent être réutilisés et partagés publiquement, devenant ainsi des références utiles pour la communauté. Enfin, la plateforme propose de nombreux tutoriels et un service d'assistance.
        Gildas Le Corguillé
        Bio.tools link

      Communautés ELIXIR-FR

      Les communautés ELIXIR correspondent à des groupes d’utilisateurs des services d’ELIXIR formellement reconnus par l’infrastructure. Elles doivent guider les développements des services long terme des plateformes pour répondre aux besoins de leurs communautés de scientifiques. Cette collaboration avec ELIXIR permet d’apporter des solutions à leurs problèmes en terme de gestion de données, de calcul en cloud et de partage de données entre pays construites sur des bases technologiques stables et fiables.

       

      ELIXIR-FR co-coordonne en particulier plusieurs communautés :

       

      ELIXIR-FR a des points de contact français dans les autres communautés :

      Plateformes ELIXIR-FR

      Les activités de l’infrastructure ELIXIR sont organisées en 5 domaines appelés “plateformes”: Données (Data), Outils (Tools), Interopérabilité (Interoperability), Infrastructure (Compute) et formation (Training).

      ELIXIR-FR a des représentants dans chacune de ces plateformes, dont le rôle est de coordonner les activités françaises:

      • Tools : Hervé Menager, Olivier Sallou
      • Data : David Salgado
      • Compute : Christophe Blanchet, Olivier Collin, Olivier Sallou, Julien Seiler
      • Interoperability : Marie-Dominique Desvignes, Alban Gaignard
      • Training : Victoria Dominguez Del Angel, Olivier Sand

      Formations ELIXIR-FR

      ELIXIR propose trois type de formations en lien avec le type de participant :

      • Des formations dédiées aux chercheurs plutôt sous forme de workshops où les participants apportent leurs propres données
      • Des formations dédiées aux développeurs et qui visent à partager les bonnes pratiques et les connaissances.
      • Des formations dédiées aux formateurs et afin de leur donner des outils pédagogiques efficaces.

       

      IFB - Institut Français de Bioinformatique ♦ CNRS UMS 3601 ♦ IFB-Core, Génoscope - 2 rue Gaston Crémieux, 91057 - ÉVRY – CEDEX ANR-11-INBS-0013236
      linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram