Département des Sciences et technologies

2025-2026

Avenue Victor Maistriau 8a
7000 Mons

Fiche ects de l'unité d'enseignement #2365 intitulée :

Informatique pour le séquençage

Master en Sciences de l'Ingénieur industriel orientation Life data technologies / Cycle 2 Bloc 1

Informations

Responsable d'UE : Vincent BRANDERS

Bloc : MA1 LDT

Période : 2e quadrimestre

Durée : 60 h

Crédits : 5 ects

UE Prérequises : aucune

UE Corequises : aucune

Activités d'apprentissage (AA)

Connaissances et compétences préalables

Séquencage nouvelle génération1 et services web bioinformatique
 

High-throughput sequencing algorithms :

Contribution aux objectifs du référentiel de compétences de l'ARES

Acquis d'apprentissage spécifiques

Capacité à définir le processus adéquat pour traiter des données NGS dans le cadre d'une recherche en particulier.
Aptitude à exploiter les ressources existantes pour les intégrer à un projet de recherche.

Contenu des AA

Exploitation des ressources bioinformatiques

L'amplification du recours aux techniques NGS dans tous les pans de la recherche biologique aboutit à l'engorgement quotidien de ce type de données dans leur différentes phases de maturation ; données brutes, filtrées,nettoyées, assemblées, corrigées. Nous allons adresser ces questions en puisant abondamment au sein des banques afin de répéter les différentes étapes de finalisation allant des données brutes initiales pour finir par un résultat d'analyse complet : génome complet, analyse des variations dans le profil d'expression par exemple. Nous allons "rejouer" les travaux effectués lors des stages/TFEs des étudiants des annéesprécédentes lorsque les dites données sont rendues publiques.

High-throughput sequencing algorithms

  • Rappels du séquençage à haut débit (NGS) et à ses applications.
  • Algorithmes d’alignement de séquences (Needleman-Wunsch, Smith-Waterman, BLAST).
  • Concepts de k-mers et leur utilisation dans l’assemblage de génomes (graphes de De Bruijn, filtres de Bloom).
  • Assemblage de novo et problèmes liés aux séquences répétitives dans les génomes.
  • Gestion des erreurs de séquençage, et méthodes de correction des erreurs (ex. : normalisation digitale, correction des erreurs par k-mers).
  • Étude des structures de données pour les séquences et indexage : arbres de suffixes, tries, et index de suffixes.

Répartition des heures

Exploitation des ressources bioinformatiques : 10 h de théorie, 20 h d'exercices/Labos

High-throughput sequencing algorithms : 15 h de théorie, 15 h d'exercices/Labos

Méthodes d'enseignement

Exploitation des ressources bioinformatiques : cours magistral, travaux de groupes, approche interactive, utilisation de logiciels

High-throughput sequencing algorithms : cours magistral, approche par projets, approche interactive

Langues d'enseignement

Exploitation des ressources bioinformatiques : français

High-throughput sequencing algorithms : français

Supports

Exploitation des ressources bioinformatiques : notes de cours, activités sur eCampus

High-throughput sequencing algorithms : copies de présentations

Ressources bibliographiques

Exploitation des ressources bioinformatiques

-

High-throughput sequencing algorithms

Ukkonen, E. « On-line construction of suffix trees. » Algorithmica, 1995.

Margaret Dayhoff et al. « Atlas of protein sequence and structure », 1966

Pevzner, P. « Computational Molecular Biology: An Algorithmic Approach », MIT Press, 2000

Fedoroff, N. « Transposable elements, epigenetics, and genome evolution. » Science, 2012

Évaluation et pondération

Méthode d'évaluation : note globale à l'UE

Langues d'évaluation : français

Modalités d'évaluation :

Pondération 50% Algorithmes de séquencage haut débit et 50% Exploitation des ressources bioinformatiques

Examen oral avec exercices pratique pour Exploitation des ressources bioinformatiques.

High-throughput sequencing algorithms :

  • Examen écrit

Report de note d'une année à l'autre pour l'AA réussie en cas d'échec à l'UE :