Inscription manuelle de participants

Beaucoup d applications modernes (données web, génomique, finance, e-marketing, etc.) requièrent de manipuler et traiter des données de très grande dimension. La discipline qui développe et étudie des méthodes concrètes pour modéliser ce type de données Beaucoup dapplications modernes (données web, génomique, finance, e-marketing, etc.) requièrent de manipuler et traiter des données de très grande dimension. La discipline qui développe et étudie des méthodes concrètes pour modéliser ce type de données sappelle lapprentissage statistique (statistical machine learning). Il sagit, in fine, de produire des outils de prédiction et daide à la décision dédiés à une application spécifique. Lapparition dalgorithmes très performants pour la classification de données en grande dimension, tels que le boosting ou les Support Vector Machines dans le milieu des années 90, a progressivement transformé le champ occupé jusqualors par la statistique traditionnelle qui sappuyait en grande partie sur le prétraitement réalisé par lopérateur humain. En sappuyant sur la théorie popularisée par Vapnik (The Nature of Statistical Learning, 1995), un nouveau courant de recherche est né: il se situe à linterface entre les communautés mathématique et informatique et mobilise un nombre croissant de jeunes chercheurs tournés vers les applications liées à lanalyse de données massives. Dans ce module, on présentera le domaine, ses fondements, les problèmes quil permet daborder (problèmes supervisés et non supervisés), et les méthodes les plus récentes qui sont actuellement étudiées (SVM, Boosting, Lasso, etc.). Lintérêt de ces concepts et techniques sera illustré au travers applications concrètes et variées (données textuelles, images, signaux audio, données génomiques, problèmes industriels, etc.)

Les visiteurs anonymes ne peuvent pas accéder à ce cours. Veuillez vous connecter.