Introduction au Machine Learning
Apprendre à entraîner un modèle de régression linéaire
Optima Otaku - Day 1
welcome slides
- presentations
- scope
- google colab
- markdown
des stats au Machine learning
des stats au ML - importance des données - Modélisation statistique ou modélisation prédictive - Machine learning definition - Regression ou classification, Classification binaire ou multi class - supervisée vs non supervisée - UCI datasets - sklearn et slides - statsmodels
principe d’entrainement iteratif
https://skatai.com/initml/modeles-algorithmes/
- sqrt(2)
- erreur d’estimation
- learning rate
Pandas dataframes
Regression lineaire avec scikit-learn
https://skatai.com/initml/etapes-construction-modele/
- variable cible et matrice de design
- import, fit, score
- coeff de determination
- fonction de cout
- metrique d’evaluation des performances
- MSE, RMSE, MAPE etc
LR sur dataset advertising
https://skatai.com/initml/regression-lineaire/
- linearité
- conditions : linearité, normalisation, independance des variables
- ajouter un terme quadratique
- pratique sur advertising, enfants, ou autres datasets sur UCI
- load dataset dans dataframe
- exploration
- nettoyage
- normalisation
- OLS avec statsmodel : construire plusieurs modeles
- feature engineering : terme quadratiques, log etc
- meilleur modele ?
- datasets:
- auto mpg https://archive.ics.uci.edu/ml/datasets/Auto+MPG
Logistic regression
- pourquoi utiliser la regression logistique ?
- function logit
- metriques
- matrice de confusion
- loss function