Département des Sciences et technologies

2024-2025

Avenue Victor Maistriau 8a
7000 Mons

Fiche ects de l'unité d'enseignement #2355 intitulée :

Langage R et bioinformatique

Master en Sciences de l'Ingénieur industriel orientation Life data technologies / Cycle 2 Bloc 1

Informations

Responsable d'UE : Vincent BRANDERS

Bloc : MA1 LDT

Période : 1er quadrimestre

Durée : 50 h

Crédits : 4 ects

UE Prérequises : aucune

UE Corequises : aucune

Activités d'apprentissage (AA)

Connaissances et compétences préalables

- Principes de bases en biologie moléculaire et technologies de séquençage haut-débit (Illumina)
- Utiliser la ligne de commande (bash) dans un système LINUX/UNIX

Contribution aux objectifs du référentiel de compétences de l'ARES

Acquis d'apprentissage spécifiques

- Produire des figures scientifiques pertinentes et attractives en terme de visualisation mais également en terme de communication effective de résultats
- Familiarisation au language de programmation R, le Tidyverse, et Bioconductor, et leurs utilisation dans le cade d'analyses de donées de séquençage
- Développer une capacité critique vis-à-vis de résultats de l'analyse de donées CAGE et de leur distinction par rapport aux méthodes classiques (mRNA-seq)

Contenu des AA

Introduction à la programmation R

Au terme de l’AA Programmation R, l’étudiant sera capable :

   •   d’expliquer la syntaxe de base de R et d’utiliser des concepts tels que les boucles, fonctions et apply(s)
   •   d’identifier et de manipuler les types de données courants en R
   •   d’importer, lire et écrire des données dans différents formats (CSV, TSV, Excel, …)
   •   d’appliquer des opérations de base sur les données, telles que la sélection, le filtrage et le tri
   •   de créer des graphiques de base pour explorer et représenter des données et d’utiliser des packages tels que ggplot2 pour créer des visualisations plus avancées
   •   de réaliser de la manipulation avancée de données
   •   de respecter les conventions de codage R et de maintenir un code propre et bien documenté
   •   de collaborer efficacement en utilisant des outils de gestion de versions comme Git

Application du langage R à la transcriptomique

Au travers d'une analyse complète d'un jeu de données de type CAGE (Cap Analysis of Gene Expression):

  1. Nettoyage de données et controle qualité (LINUX/Unix, command line, bash/zsh)
  2. Analyses bioinformatiques des données nettoyées: mapping, quantification, annotation
  3. Quantification et expression différentielle (R, Tidyverse, Bioconductor)
  4. Présentation des résultats sous la forme de figures scientifiques

Répartition des heures

Introduction à la programmation R : 5 h de théorie, 15 h d'exercices/Labos

Application du langage R à la transcriptomique : 10 h de théorie, 20 h d'exercices/Labos

Méthodes d'enseignement

Introduction à la programmation R : travaux de groupes, approche par projets, approche interactive, approche par situation problème

Application du langage R à la transcriptomique : travaux de groupes, approche par projets, approche interactive, approche par situation problème, approche déductive, étude de cas, utilisation de logiciels

Langues d'enseignement

Introduction à la programmation R : français, anglais

Application du langage R à la transcriptomique : français, anglais

Supports

Introduction à la programmation R : copies de présentations, notes d'exercices

Application du langage R à la transcriptomique : copies de présentations, notes d'exercices, Resources et scripts disponible via un répertoire GitHub public

Ressources bibliographiques

Introduction à la programmation R

- Collection de "cheat sheets" pour la programmation R, la manipulation de données, et la production de figures scientifiques: https://www.rstudio.com/resources/cheatsheets/ 
- Guide pour la création et validation de figures scientifiques: https://www.data-to-viz.com

- Cours en ligne de datacamp

- Grolemund, Garrett, and Hadley Wickham. 2017. R for Data Science. Sebastopol, CA: O’Reilly Media.

Application du langage R à la transcriptomique

- Collection de "cheat sheets" pour la programmation R, la manipulation de données, et la production de figures scientifiques: https://www.rstudio.com/resources/cheatsheets/ 
- Guide pour la création et validation de figures scientifiques: https://www.data-to-viz.com
- Répertoire GitHub public créé spécifiquement pour le cours

Évaluation et pondération

Méthode d'évaluation : note globale à l'UE

Langues d'évaluation : français, anglais

Modalités d'évaluation :

La note finale est définie comme suit :

  • 60 % pour l'AA Compléments de techniques bioinformatiques 2
    • Une évaluation de la participation tout au long du cours (présence, attention, motivation, questions, réponses, etc.)
    • Complétion d'un examen dont le format (individuel/groupe ; interne ou via service tiers) sera défini en fonction de l'avancement par rapport au programme prévu
  • 40 % pour l'AA Programmation R :
    • Travail continu (certifications DataCamp)
    • Réalisation d'un projet

Report de note d'une année à l'autre pour l'AA réussie en cas d'échec à l'UE :