• Bonjour!

    Not published to students
    Current

    Le contenu du  cours est accessible à tous sans inscription sous une license [ CC-BY-SA ]. Pour accéder aux tests et recevoir des notes il faut cependant être inscrit au cours.


    [AMPHIS: les MERCREDIS de 8h15 à 9h15 dans votre salle virtuelle usuelle ]

    1. MARS 10
    2. MARS 24
    3. MARS 31
    4. AVRIL 7
    5. AVRIL 14
    6. AVRIL 21
    7. MAI 5
    8. MAI 12
    9. MAI 19


    Je m'appelle Isabelle Guyon ( voir ma page web ). Je suis prof depuis 2015 à Paris-Saclay. On m'a fait venir pour essayer de communiquer le virus du "machine learning" et de la science des données (qui occupent une part grandissante des techniques d'Intelligence Artificielle).

    J'ai créé ce cours de L1 l'an dernier avec Nicolas Thiéry { voir version de 2019/2020 ). A partir de 2020/2021, ce cours est obligatoire en L1 MI et le cours de L2 info est ramené à 9 semaines, car certaines bases de sciences des données et de Python sont désormais couvertes en L1 (il y a maintenant aussi un cours de programmation Python en S1).

    Ce cours de L1 a un socle pratique important  (1h de cours et 2h de TP, pendant 9 semaines). Il est agencé de façon à donner un aperçu complet de la chaîne de traitement d'un problème de sciences des données, tout en introduisant des concepts de statistique et de vision par ordinateur de base. La progression du cours (version 2020/2021) est la suivante:

    Première partie:

    • 1.  Introduction et statistiques de base (moyenne, médiane, quartiles, histogrammes) [DIAPOS]
      Sujet de TP et devoirs à la maison
    • 2. Exemple de chaîne complète de traitement (mini-problème de classification d'images de fruits simplifié, méthodes des plus proches voisins, training/test set, taux de succès, barres d'erreur) [DIAPOS]
    • 3. Explorations, visualisations, et fins des rappels de stats  [DIAPOS]
    • 4. Représentation des donnée (extraction de features, selection de features) [DIAPOS]
    • 5. Classifieurs (linéaires, plus proches voisins, arbres de décision, etc.) [DIAPOS]

    Deuxième partie:

    • 6. Vision par ordinateur (reprise de l'exemple de la leçon (2), avec de vraies images
    • 7 Biais dans les données
    • 8.   Réseaux de neurones
    • 9 . Architectures profondes
                      

    La première partie entre dans le concret des algorithmes tandis que la seconde donne un aperçu de notions plus avancées sans détails matheux.

    Les TPs consistent en un ensemble de notebooks Jupyter en Python , inspirés du cours Data8 de UC Berkeley. Ils sont de deux types, fournis en alternance: (1) TP courts individuel noté automatiquement, durée 1 séance; (2) TP longs en binômes. Le dernier TP long se termine par une présentation orale finale. La structure d'un TP long est similaire à celle du TP court qui la précède, et en développe le sujet en demandant aux étudiants d'y appliquer d'autres données (soit des données suggérées, soit des données de leur choix).

    A bientôt!

    f aq

Course Dashboard