Introduction à la programmation R : 20 h, Vincent BRANDERS
Application du langage R à la transcriptomique : 30 h, Axel THIEFFRY
Connaissances et compétences préalables
- Principes de bases en biologie moléculaire et technologies de séquençage haut-débit (Illumina) - Utiliser la ligne de commande (bash) dans un système LINUX/UNIX
Contribution aux objectifs du référentiel de compétences de l'ARES
Identifier, conceptualiser et résoudre des problèmes complexes
Intégrer les savoirs scientifiques et technologiques afin de faire face à la diversité et à la complexité des problèmes rencontrés
Analyser des produits, processus et performances, de systèmes techniques nouveaux et innovants
Concevoir, développer et améliorer des produits, processus et systèmes techniques
Modéliser, calculer et dimensionner des systèmes
Sélectionner et exploiter les logiciels et outils conceptuels les plus appropriés pour résoudre une tâche spécifique
Établir ou concevoir un protocole de tests, de contrôles et de mesures.
Concevoir et gérer des projets de recherche appliquée
Réunir les informations nécessaires au développement de projets de recherche
Réaliser des simulations, modéliser des phénomènes afin d’approfondir les études et la recherche sur des sujets technologiques ou scientifiques
Mener des études expérimentales, en évaluer les résultats et en tirer des conclusions
Valider les performances et certifier les résultats en fonction des objectifs attendus
Exploiter les résultats de recherche
S’intégrer et contribuer au développement de son milieu professionnel
Planifier le travail en respectant les délais et contraintes du secteur professionnel (sécurité …)
Travailler en autonomie et en équipe dans le respect de la culture d’entreprise
Entreprendre et innover, dans le cadre de projets personnels ou par l’initiative et l’implication au
sein de l’entreprise
Dépasser les cadres ou les limites d’un problème et apporter des solutions innovantes
Communiquer face à un public de spécialistes ou de non-spécialistes, dans des contextes
nationaux et internationaux
Maitriser les méthodes et les moyens de communication en les adaptant aux contextes et aux publics
Communiquer dans une ou plusieurs langues étrangères
S’engager dans une démarche de développement professionnel
Réaliser une veille technologique dans sa sphère d’expertise
S’autoévaluer pour identifier ses besoins de développement
Assumer la responsabilité de ses décisions et de ses choix
Organiser son savoir de manière à améliorer son niveau de compétence
Actualiser ses connaissances et s’engager dans les formations complémentaires adéquates
Acquis d'apprentissage spécifiques
- Produire des figures scientifiques pertinentes et attractives en terme de visualisation mais également en terme de communication effective de résultats - Familiarisation au language de programmation R, le Tidyverse, et Bioconductor, et leurs utilisation dans le cade d'analyses de donées de séquençage - Développer une capacité critique vis-à-vis de résultats de l'analyse de donées CAGE et de leur distinction par rapport aux méthodes classiques (mRNA-seq)
Contenu des AA
Introduction à la programmation R
Au terme de l’AA Programmation R, l’étudiant sera capable :
• d’expliquer la syntaxe de base de R et d’utiliser des concepts tels que les boucles, fonctions et apply(s) • d’identifier et de manipuler les types de données courants en R • d’importer, lire et écrire des données dans différents formats (CSV, TSV, Excel, …) • d’appliquer des opérations de base sur les données, telles que la sélection, le filtrage et le tri • de créer des graphiques de base pour explorer et représenter des données et d’utiliser des packages tels que ggplot2 pour créer des visualisations plus avancées • de réaliser de la manipulation avancée de données • de respecter les conventions de codage R et de maintenir un code propre et bien documenté • de collaborer efficacement en utilisant des outils de gestion de versions comme Git
Application du langage R à la transcriptomique
Au travers d'une analyse complète d'un jeu de données de type CAGE (Cap Analysis of Gene Expression):
Nettoyage de données et controle qualité (LINUX/Unix, command line, bash/zsh)
Analyses bioinformatiques des données nettoyées: mapping, quantification, annotation
Quantification et expression différentielle (R, Tidyverse, Bioconductor)
Présentation des résultats sous la forme de figures scientifiques
Répartition des heures
Introduction à la programmation R : 5 h de théorie, 15 h d'exercices/Labos
Application du langage R à la transcriptomique : 10 h de théorie, 20 h d'exercices/Labos
Méthodes d'enseignement
Introduction à la programmation R : travaux de groupes, approche par projets, approche interactive, approche par situation problème
Application du langage R à la transcriptomique : travaux de groupes, approche par projets, approche interactive, approche par situation problème, approche déductive, étude de cas, utilisation de logiciels
Langues d'enseignement
Introduction à la programmation R : français, anglais
Application du langage R à la transcriptomique : français, anglais
Supports
Introduction à la programmation R : copies de présentations, notes d'exercices
Application du langage R à la transcriptomique : copies de présentations, notes d'exercices, Resources et scripts disponible via un répertoire GitHub public
Ressources bibliographiques
Introduction à la programmation R
- Collection de "cheat sheets" pour la programmation R, la manipulation de données, et la production de figures scientifiques: https://www.rstudio.com/resources/cheatsheets/ - Guide pour la création et validation de figures scientifiques: https://www.data-to-viz.com
- Cours en ligne de datacamp
- Grolemund, Garrett, and Hadley Wickham. 2017. R for Data Science. Sebastopol, CA: O’Reilly Media.
Application du langage R à la transcriptomique
- Collection de "cheat sheets" pour la programmation R, la manipulation de données, et la production de figures scientifiques: https://www.rstudio.com/resources/cheatsheets/ - Guide pour la création et validation de figures scientifiques: https://www.data-to-viz.com - Répertoire GitHub public créé spécifiquement pour le cours
Évaluation et pondération
Méthode d'évaluation : note globale à l'UE
Langues d'évaluation : français, anglais
Modalités d'évaluation :
La note finale est définie comme suit :
60 % pour l'AA Compléments de techniques bioinformatiques 2
Une évaluation de la participation tout au long du cours (présence, attention, motivation, questions, réponses, etc.)
Complétion d'un examen dont le format (individuel/groupe ; interne ou via service tiers) sera défini en fonction de l'avancement par rapport au programme prévu
40 % pour l'AA Programmation R :
Travail continu (certifications DataCamp)
Réalisation d'un projet
Report de note d'une année à l'autre pour l'AA réussie en cas d'échec à l'UE :
Introduction à la programmation R : non
Application du langage R à la transcriptomique : non