Des stats au machine learning
Cours introductif en machine learning a partir de l'analyse statistique de jeux de données
Des stats au machine learning
Cours introductif en machine learning / apprentissage automatique à partir de l’analyse statistique de jeux de données.
La regression lineaire reste d’actualité a l’ere des reseaux de neurones et de l’intelligence artificielle.
Le cours débute par la regresison linearire dans une approche statistique d’explication des dynamiques au sein d’un jeu de donnée. cela nous permet d’intrduire les notions de classification et de regression. ainsi que les principales metriques et criteres d’evaluations. Cette etape franchie, il suffit alors de scinder le jeux de données en une partie apprentissage et une partie d’evaluation pour introduire le machine learning. Les notions de overfit et de biais sont expliquées Pour conclure le cours, la regression linearire cède la place aux modeles construits sur des arbres de décisions, plus puissant et plus robustes.
Partie 1: Introduction aux concepts fondamentaux du Machine Learning
- Comprendre l’intérêt du Machine Learning - Comprendre les concepts fondamentaux du Machine Learning et ses applications
- Modèles et algorithmes - Découvrir les différents types de modèles et algorithmes d’apprentissage automatique
- Modes d’apprentissage - Décrypter les modes d’apprentissage et différencier ML du Deep Learning
- Du business à la production - Passer d’une problématique business à la mise en production d’un modèle ML
- Quiz Partie 1 - Quiz d’évaluation des concepts fondamentaux du Machine Learning
- Quiz Partie 1 (v2) - Quiz alternatif sur les concepts fondamentaux du ML
Partie 2: Techniques d’entraînement pratique
- Construction d’un modèle prédictif - Maîtriser les étapes pratiques de construction d’un modèle prédictif
- Régression linéaire - Apprendre à entraîner un modèle de régression linéaire
- Régression logistique - Apprendre à classifier avec la régression logistique
- Clustering k-means - Découvrir le clustering et l’algorithme k-means
- Quiz Partie 2 - Quiz sur les techniques d’entraînement de modèles ML
Partie 3: Optimisation des données et du modèle
- Qualité des données - Comprendre l’importance de la qualité des données en ML
- Nettoyage des données - Améliorer et nettoyer un jeu de données pour l’ML
- Transformation des variables - Transformer les variables pour optimiser l’apprentissage du modèle
- Overfitting et régularisation - Éviter l’overfitting avec la régularisation
- Démonstration régularisation - Démonstration pratique de la régularisation
- Quiz Partie 3 - Quiz sur l’amélioration des données et la régularisation
Partie 4: Modèles avancés
- Modèles basés sur les arbres - Travailler avec des modèles basés sur les arbres de décision
- Apprentissage d’ensemble - Découvrir l’apprentissage d’ensemble et les méthodes de combinaison
- Quiz Partie 4 - Quiz final sur les modèles avancés et l’ensemble learning