Projets de spécialité Bioinfo Apprentissage : Différence entre versions

De Ensiwiki
Aller à : navigation, rechercher
(Description projet bio-info et apprentissage)
 
Ligne 3 : Ligne 3 :
 
[[Catégorie:Projets de spécialité]]
 
[[Catégorie:Projets de spécialité]]
  
Bienvenue sur la page des projets de spécialité Bioinformatique, Apprentissage Automatique.  
+
Elèves de toutes les filières, bienvenue sur la page des projets de spécialité bioinformatique, Apprentissage Automatique. Attention : une équipe doit comporter au minimum 3 élèves!
 
   
 
   
 
=== Objectif des projets de bioinformatique ===
 
=== Objectif des projets de bioinformatique ===
  
Un des objectifs de ce projet est de mettre en oeuvre vos connaissances acquises en cours à travers un problème applicatif et en utilisant l'outil informatique. C'est l'occasion de vous faire découvrir une thématique pointue non abordée en cours, mais néanmoins en lien avec certains cours que vous avez suivi. Généralement, on vous demande de comprendre un problème particulier et de réaliser une modélisation (mathématique) et de développer et d'implémenter un algorithme pour répondre à ce problème. Votre travail aboutira alors au développement d'un logiciel de simulation, basé sur des concepts mathématiques, des méthodes numériques et de la modélisation. Vous devez ensuite, lors de la soutenance et sur le rapport, être capables d'expliquer à un non-spécialiste la problématique posée et la façon dont vous y avez répondu.
+
La bioinformatique est un champ interdisciplinaire dont le but est de développer les méthodes d'analyse permettant d'interpréter les données biologiques, notamment issues des projets de génomique. Les données génomiques sont complexes et massives. La bioinformatique combine l'informatique, les statistiques et l'algorithmique pour analyser les données biologiques. Les personnels encadrant la bioinformatique sont des chercheurs extérieurs à l'école. Pour effectuer un projet en bioinformatique, contacter le responsable du projet de spécialité pour définir un sujet et contacter un chercheur (les élèves du cours de Modélisation en Biologie peuvent contacter l'un des intervenants). Les thèmes abordés sont très variés et ne se limitent pas à une filière en particulier. Connaître un langage de script (Python, R, Perl) peut être utile. Un tour d'horizon des thèmes abordés est disponible sur la page suivante : 
  
 
https://en.wikipedia.org/wiki/Bioinformatics
 
https://en.wikipedia.org/wiki/Bioinformatics
  
 +
De nombreuses méthodes bioinformatiques utilisent l'apprentissage automatique.
  
=== Fonctionnement ===
+
=== Objectif des projets en apprentissage ===
Vous travaillez en binôme, à temps plein pendant 3/4 semaines et vous êtes encadrés par le responsable de votre projet. L'enseignant responsable consacre -en moyenne- 3 heures hebdomadaire par binômes. Le lieu et les dates de rendez-vous sont à fixer avec votre responsable.
+
  
=== Délivrables et évaluation ===
+
L'apprentissage automatique (machine learning) est un champ d'étude interdisciplinaire s'appuyant sur l'informatique et les statistiques concernant le développement de méthodes permettant à un programme d'apprendre une tache ou de prédire des événements à partir d'observations statistiques. Cette discipline est à la base de la "science des données" prépondérante dans le monde académique et industriel à l'heure actuelle.
Vous rédigerez un rapport et exposerez votre travail lors d'une soutenance orale de 20 min+10 min de questions-discussion avec le jury (le jury est compose des différents intervenants). Pour la soutenance, vous disposez de tout le materiel nécessaire: video-projecteur, ordinateur portable et tableau noir si besoin. La note depend de la qualité de votre travail au cours des 3/4 semaines -"appréciation continue"-, et aussi bien sur de la qualité de votre rapport et de votre soutenance orale.  
+
  
Le rapport sera soit sous forme écrite d'une quinzaine de pages (...graphes non inclus...) soit sous forme d'une page web, notamment sur EnsiWiki décrivant la méthode et les principaux résultats.  
+
https://en.wikipedia.org/wiki/Machine_learning
Par ailleurs, vous serez évalués sur la présentation elle-même et sur la gestion de projet par une autre note, qui compte pour un crédit ECTS. Pour cette seconde évaluation, voir avec les enseignants de SHEME. A ce sujet '''quelques règles pour la rédaction du rapport''' sont disponibles sur [https://ensiwiki.ensimag.fr/index.php/Rédaction_de_documents_écrits cette page].
+
 
 +
A la différence du projet précédent, les sujets proposés sont disponibles sur un site externe. L'objectif est de former une équipe pour participer à un challenge sur un problème de prédiction ouvert choisi dans un site web dédié, tel le site "kaggle". Les thèmes abordés sont très variés et changent souvent. Un tour d'horizon de thèmes en cours, très abordables, peut se trouver sur la page suivante : 
 +
 
 +
https://inclass.kaggle.com/
 +
 
 +
Votre tuteur école jouera le role de coach et pourra vous aider à mettre en place des méthodes pour répondre au challenge choisi. Les projets ne sont ne se limitent pas à une filière en particulier. Connaître un langage de script (Python, R, Perl) peut être utile. les méthodes d'apprentissage automatique sont aussi très utilisées en bioinformatique.
 +
 
 +
 
 +
=== En pratique (Teide et tout ca) ===
 +
 
 +
Vous avez une idée du sujet qui vous intéresse, en bioinformatique ou en apprentissage automatique. La première étape est de trouver au moins deux partenaires pour constituer une équipe. Une fois l'équipe constituée et une thématique commune ciblée, **prendre rendez vous par messagerie avec le responsable du projet**. Une fois l'équipe validée, il créera pour votre équipe une entrée dans Teide (nommée, par exemple, projet 2). Vous devrez alors vous inscrire sur Teide pour la validation finale, en suivant le calendrier du projet de spécialité.  
 +
 
 +
 
 +
=== Evaluation ===
 +
 
 +
Pre-rapport, rapport et soutenance orale. Quelques règles pour la rédaction du rapport sont disponibles sur [https://ensiwiki.ensimag.fr/index.php/Rédaction_de_documents_écrits cette page].

Version du 30 mars 2016 à 13:43

AttentionCette page est maintenue par les enseignants et utilisée par les élèves de la matière concernée. Vos contributions sont les bienvenues, mais merci d'en discuter avant de faire des modifications non triviales de la page, pour être sûr de ne pas perturber le déroulement du cours.

Mycomputer.png  Deuxième Année  CDROM.png  Informatique  Mathematiques.png  Mathématiques 

Elèves de toutes les filières, bienvenue sur la page des projets de spécialité bioinformatique, Apprentissage Automatique. Attention : une équipe doit comporter au minimum 3 élèves!

Objectif des projets de bioinformatique

La bioinformatique est un champ interdisciplinaire dont le but est de développer les méthodes d'analyse permettant d'interpréter les données biologiques, notamment issues des projets de génomique. Les données génomiques sont complexes et massives. La bioinformatique combine l'informatique, les statistiques et l'algorithmique pour analyser les données biologiques. Les personnels encadrant la bioinformatique sont des chercheurs extérieurs à l'école. Pour effectuer un projet en bioinformatique, contacter le responsable du projet de spécialité pour définir un sujet et contacter un chercheur (les élèves du cours de Modélisation en Biologie peuvent contacter l'un des intervenants). Les thèmes abordés sont très variés et ne se limitent pas à une filière en particulier. Connaître un langage de script (Python, R, Perl) peut être utile. Un tour d'horizon des thèmes abordés est disponible sur la page suivante :

https://en.wikipedia.org/wiki/Bioinformatics

De nombreuses méthodes bioinformatiques utilisent l'apprentissage automatique.

Objectif des projets en apprentissage

L'apprentissage automatique (machine learning) est un champ d'étude interdisciplinaire s'appuyant sur l'informatique et les statistiques concernant le développement de méthodes permettant à un programme d'apprendre une tache ou de prédire des événements à partir d'observations statistiques. Cette discipline est à la base de la "science des données" prépondérante dans le monde académique et industriel à l'heure actuelle.

https://en.wikipedia.org/wiki/Machine_learning

A la différence du projet précédent, les sujets proposés sont disponibles sur un site externe. L'objectif est de former une équipe pour participer à un challenge sur un problème de prédiction ouvert choisi dans un site web dédié, tel le site "kaggle". Les thèmes abordés sont très variés et changent souvent. Un tour d'horizon de thèmes en cours, très abordables, peut se trouver sur la page suivante :

https://inclass.kaggle.com/

Votre tuteur école jouera le role de coach et pourra vous aider à mettre en place des méthodes pour répondre au challenge choisi. Les projets ne sont ne se limitent pas à une filière en particulier. Connaître un langage de script (Python, R, Perl) peut être utile. les méthodes d'apprentissage automatique sont aussi très utilisées en bioinformatique.


En pratique (Teide et tout ca)

Vous avez une idée du sujet qui vous intéresse, en bioinformatique ou en apprentissage automatique. La première étape est de trouver au moins deux partenaires pour constituer une équipe. Une fois l'équipe constituée et une thématique commune ciblée, **prendre rendez vous par messagerie avec le responsable du projet**. Une fois l'équipe validée, il créera pour votre équipe une entrée dans Teide (nommée, par exemple, projet 2). Vous devrez alors vous inscrire sur Teide pour la validation finale, en suivant le calendrier du projet de spécialité.


Evaluation

Pre-rapport, rapport et soutenance orale. Quelques règles pour la rédaction du rapport sont disponibles sur cette page.