Objectifs de la formation
- Maîtriser les bibliothèques Python avancées (Pandas, NumPy, Scikit-learn)
- Manipuler et nettoyer de grandes bases de données
- Créer des modèles prédictifs robustes avec des algorithmes de machine learning
- Évaluer la performance d’un modèle et l’améliorer
- Automatiser des tâches d’analyse et construire des pipelines de données
Public visé
Professionnels ayant déjà des bases en data science ou ayant suivi le niveau débutant, souhaitant renforcer leurs compétences pour travailler sur des projets concrets d’analyse prédictive.
Programme détaillé
- Nettoyage et préparation des données (feature engineering)
- Utilisation avancée de Pandas et Numpy
- Introduction aux algorithmes supervisés : régression, classification
- Modèles non-linéaires : k-NN, arbres de décision, random forest
- Évaluation des modèles : cross-validation, matrices de confusion, scoring
- Initiation à la visualisation des résultats avec Seaborn / Matplotlib
- Création d’un mini-projet d’analyse de données
Durée & Modalités
Durée : 4 jours (28 heures) – en présentiel ou à distance
Support de cours fourni – Exercices pratiques – Accompagnement par un formateur expert