Exploitation des ressources bioinformatiques : 30 h, David COORNAERT
High-throughput sequencing algorithms : 30 h, Vincent BRANDERS
Connaissances et compétences préalables
Séquencage nouvelle génération1 et services web bioinformatique
High-throughput sequencing algorithms :
Bioinformatique de base : notions de biologie moléculaire, en particulier concernant l’ADN, les séquences nucléotidiques et les processus évolutifs.
Algorithmes : maîtrise des concepts d’algorithmes classiques (complexité, structures de données) et notions de programmation.
Statistiques : compréhension des probabilités et des statistiques pour l’analyse des données issues du séquençage à haut débit.
Contribution aux objectifs du référentiel de compétences de l'ARES
Identifier, conceptualiser et résoudre des problèmes complexes
Intégrer les savoirs scientifiques et technologiques afin de faire face à la diversité et à la complexité des problèmes rencontrés
Analyser des produits, processus et performances, de systèmes techniques nouveaux et innovants
Concevoir, développer et améliorer des produits, processus et systèmes techniques
Modéliser, calculer et dimensionner des systèmes
Sélectionner et exploiter les logiciels et outils conceptuels les plus appropriés pour résoudre une tâche spécifique
Concevoir et gérer des projets de recherche appliquée
Réunir les informations nécessaires au développement de projets de recherche
Réaliser des simulations, modéliser des phénomènes afin d’approfondir les études et la recherche sur des sujets technologiques ou scientifiques
Mener des études expérimentales, en évaluer les résultats et en tirer des conclusions
Valider les performances et certifier les résultats en fonction des objectifs attendus
Exploiter les résultats de recherche
Développer une vision prospective et intégrer les développements de la recherche dans la pratique professionnelle
S’intégrer et contribuer au développement de son milieu professionnel
Planifier le travail en respectant les délais et contraintes du secteur professionnel (sécurité …)
S’engager dans une démarche de développement professionnel
Réaliser une veille technologique dans sa sphère d’expertise
S’autoévaluer pour identifier ses besoins de développement
Assumer la responsabilité de ses décisions et de ses choix
Organiser son savoir de manière à améliorer son niveau de compétence
Actualiser ses connaissances et s’engager dans les formations complémentaires adéquates
Acquis d'apprentissage spécifiques
Capacité à définir le processus adéquat pour traiter des données NGS dans le cadre d'une recherche en particulier. Aptitude à exploiter les ressources existantes pour les intégrer à un projet de recherche.
Contenu des AA
Exploitation des ressources bioinformatiques
L'amplification du recours aux techniques NGS dans tous les pans de la recherche biologique aboutit à l'engorgement quotidien de ce type de données dans leur différentes phases de maturation ; données brutes, filtrées,nettoyées, assemblées, corrigées. Nous allons adresser ces questions en puisant abondamment au sein des banques afin de répéter les différentes étapes de finalisation allant des données brutes initiales pour finir par un résultat d'analyse complet : génome complet, analyse des variations dans le profil d'expression par exemple. Nous allons "rejouer" les travaux effectués lors des stages/TFEs des étudiants des annéesprécédentes lorsque les dites données sont rendues publiques.
High-throughput sequencing algorithms
Rappels du séquençage à haut débit (NGS) et à ses applications.
Algorithmes d’alignement de séquences (Needleman-Wunsch, Smith-Waterman, BLAST).
Concepts de k-mers et leur utilisation dans l’assemblage de génomes (graphes de De Bruijn, filtres de Bloom).
Assemblage de novo et problèmes liés aux séquences répétitives dans les génomes.
Gestion des erreurs de séquençage, et méthodes de correction des erreurs (ex. : normalisation digitale, correction des erreurs par k-mers).
Étude des structures de données pour les séquences et indexage : arbres de suffixes, tries, et index de suffixes.
Répartition des heures
Exploitation des ressources bioinformatiques : 10 h de théorie, 20 h d'exercices/Labos
High-throughput sequencing algorithms : 15 h de théorie, 15 h d'exercices/Labos
Méthodes d'enseignement
Exploitation des ressources bioinformatiques : cours magistral, travaux de groupes, approche interactive, utilisation de logiciels
High-throughput sequencing algorithms : cours magistral, approche par projets, approche interactive
Langues d'enseignement
Exploitation des ressources bioinformatiques : français
High-throughput sequencing algorithms : français
Supports
Exploitation des ressources bioinformatiques : notes de cours, activités sur eCampus
High-throughput sequencing algorithms : copies de présentations
Ressources bibliographiques
Exploitation des ressources bioinformatiques
-
High-throughput sequencing algorithms
Ukkonen, E. « On-line construction of suffix trees. » Algorithmica, 1995.
Margaret Dayhoff et al. « Atlas of protein sequence and structure », 1966
Pevzner, P. « Computational Molecular Biology: An Algorithmic Approach », MIT Press, 2000
Fedoroff, N. « Transposable elements, epigenetics, and genome evolution. » Science, 2012
Évaluation et pondération
Méthode d'évaluation : note globale à l'UE
Langues d'évaluation : français
Modalités d'évaluation :
Pondération 50% Algorithmes de séquencage haut débit et 50% Exploitation des ressources bioinformatiques
Examen oral avec exercices pratique pour Exploitation des ressources bioinformatiques.
High-throughput sequencing algorithms :
Examen écrit
Report de note d'une année à l'autre pour l'AA réussie en cas d'échec à l'UE :
Exploitation des ressources bioinformatiques : oui