Banques et indexation des données biologiques : 30 h, David COORNAERT
Connaissances et compétences préalables
-
Contribution aux objectifs du référentiel de compétences de l'ARES
Communiquer et informer
Utiliser le vocabulaire adéquat
Présenter des prototypes de solution et d’application techniques
Collaborer à la conception, à l’amélioration et au développement de projets techniques
Elaborer une méthodologie de travail
Analyser une situation donnée sous ses aspects techniques et scientifiques
Rechercher et utiliser les ressources adéquates
Proposer des solutions qui tiennent compte des contraintes
S’engager dans une démarche de développement professionnel
S’informer et s’inscrire dans une démarche de formation permanente
Développer une pensée critique
Travailler tant en autonomie qu’en équipe dans le respect de la structure de l’environnement professionnel
S’inscrire dans une démarche de respect des réglementations
Respecter les normes, les procédures et les codes de bonne pratique
Apporter les solutions techniques en réponse aux questionnements spécifiques dans le domaine biologique
Exploiter les connaissances de base des sciences du vivant.
Analyser les besoins matériels et les mettre en oeuvre.
Préparer l’analyse et l’exploitation des résultats des dispositifs de collecte de données
Maîtriser les outils informatiques et bioinformatiques et en assurer une veille technologique
Mettre en place et gérer les droits d’accès des utilisateurs sur une plate‐forme bioinformatique
Installer et mettre à jour les suites de logiciels bioinformatiques
Identifier les spécificités des logiciels bioinformatiques, adapter leurs paramètres et exploiter leurs fonctionnalités
Maintenir, répliquer, accéder aux bases de données biologiques et assurer leur sécurité
Elaborer des programmes d’automatisation des tâches répétitives, de backup et de rapatriement de données
Assurer la fonctionnalité des appareillages
Maintenir et exploiter un réseau informatique
Acquis d'apprentissage spécifiques
Au cours de ce cycle de formations, les apprenants parviendront à mettre un place un système linux à vocation bioinformatique, a y implanter une partie des banques de données majeures et à les rendre accessibles au travers de différents systèmes bioinformatiques.
Contenu des AA
Systèmes d'exploitation
Installation d'un serveur linux Gentoo
Installation de services bioinformatiques, et des outils de base de la discipline.
Biostatistiques
Statistique descriptive à 1 dimension.
Notions sur le calcul de probabilités et les lois de probabilités.
Inférence statistique - partie 1: échantillonnage, estimation, estimateurs, intervalles de confiance.
Inférence statistique - partie 2: tests d'hypothèses.
Statistique descriptive à deux dimensions: régression linéaire et corrélation.
Introduction au logiciel statistique R.
Banques et indexation des données biologiques
Les banques de données biologiques sont volumineuses et nécessitent d'être explorées préalablement, afin de permettre à leurs utilisateurs d'aller retrouver une ou des données en particulier parmi des centaines de millions.
Les apprenants auront à concevoir un système permettant d'aller rechercher rapidement un élément particulier (une gène donné) dans une série de fichiers englobant chacun des dizaines de milliers de séquences d'ADN ou d'autres objets biologiques. (fraction faible des banques biologiques pour garder ce travail réalisable sur un ordinateur personnel non spécialisé)
Les avantages et inconvénients des systèmes d'indexation préexistants seront découverts et expérimentés.
Répartition des heures
Systèmes d'exploitation : 5 h de théorie, 45 h d'exercices/Labos
Biostatistiques : 15 h de théorie, 15 h d'exercices/Labos
Banques et indexation des données biologiques : 10 h de théorie, 20 h d'exercices/Labos
Méthodes d'enseignement
Systèmes d'exploitation : cours magistral, approche interactive, étude de cas, utilisation de logiciels
Biostatistiques : cours magistral, approche par situation problème, utilisation de logiciels
Banques et indexation des données biologiques : travaux de groupes, approche par projets, approche avec TIC, étude de cas, utilisation de logiciels
Langues d'enseignement
Systèmes d'exploitation : français
Biostatistiques : français
Banques et indexation des données biologiques : français
Supports
Systèmes d'exploitation : notes d'exercices
Biostatistiques : copies de présentations, notes de cours, notes d'exercices
Banques et indexation des données biologiques : notes de cours, notes d'exercices, protocoles de laboratoires
Ressources bibliographiques
Systèmes d'exploitation
https://wiki.gentoo.org/wiki/Handbook:AMD64
http://wemboss.sourceforge.net/
Biostatistiques
Poinsot D., 2004. Statistiques pour statophobes. [en ligne : http://perso.univ-rennes1.fr/denis.poinsot]
Motulsky Harvey J., 2019. Biostatistique - Une approche intuitive., 3e Edition, De Boeck Supérieur.
Banques et indexation des données biologiques
http://emboss.sourceforge.net/
Évaluation et pondération
Méthode d'évaluation : note aux AA
Langues d'évaluation :
Systèmes d'exploitation : français
Biostatistiques : français
Banques et indexation des données biologiques : français
Pondération par AA :
Systèmes d'exploitation : 40 %
Biostatistiques : 30 %
Banques et indexation des données biologiques : 30 %