Machine Learning

Apprentissage supervisé et non supervisé · LMAD / MDSI · 42h

Présentation

Module créé en 2021–2022 dans le cadre de l’évolution du curriculum data science d’ESB, puis maintenu et enrichi chaque année. Approche par projet avec datasets réels.

Espace Blackboard

Espace(s) cours sur Blackboard ESB :

BA M1 : https://esprit.blackboard.com/ultra/courses/_3030_1/outline

Acquis d’apprentissage

AA1 — Comprendre la dichotomie supervisé / non supervisé / renforcement
AA2 — Maîtriser les algorithmes classiques (linéaires, arbres, ensembles)
AA3 — Évaluer un modèle (validation croisée, métriques, biais-variance)
AA4 — Pré-traiter les données (nettoyage, encodage, scaling, feature engineering)
AA5 — Implémenter un pipeline ML complet en Python avec scikit-learn
AA6 — Détecter et corriger l’overfitting
AA7 — Communiquer les résultats via dashboards et rapports

Supports pédagogiques

Type	Description	Lien
Polycopié	Cours book avec exercices corrigés	PDF
Slides	Beamer Metropolis 16:9	PDF
TDs	Énoncés + corrections	PDF
TPs Python	Pipelines scikit-learn, projets datasets réels	PDF + code
Projet	Compétition Kaggle interne	Sujet
Repository	Code source	GitHub

Plan détaillé

Introduction : taxonomie ML, vocabulaire, vue d’ensemble du pipeline
Régression linéaire et logistique : moindres carrés, descente de gradient, régularisation L1/L2
Arbres de décision et forêts aléatoires : gini, entropie, bagging, boosting
SVM : marges, kernels, dualité
K-NN, Naive Bayes : algorithmes paresseux et probabilistes
Apprentissage non supervisé : K-means, DBSCAN, hiérarchique, PCA
Évaluation : courbe ROC, matrice de confusion, validation croisée, GridSearchCV
Pipelines, sélection de features, déploiement

Outils mobilisés

scikit-learn · pandas · numpy · matplotlib · seaborn · plotly · xgboost · lightgbm

Prolongements

Module précurseur de Deep Learning, NLP et Outillage Machine Learning.

Retour au sommet