Imbalanced data Imbalanced data et Machine Learning Nous commencons cette série par un tour d’horizon des méthodes disponibles pour pallier les difficultés que présentent les données déséquilibrées.
Imbalanced data Comprendre le SMOTE et éviter ses pièges Le SMOTE, ou Synthetic Minority Oversampling TEchnique, est un algorithme qui rééquilibre les données en “fabriquant” de nouvelles données fictives, destinées à …
Imbalanced data SMOTE et données mixtes, traiter les variables catégorielles avec SMOTE-NC Adaptation du SMOTE, l’algorithme SMOTE-NC permet de rééquilibrer des données mixtes, c’est-à-dire contenant des variables numériques et …
Imbalanced data Maîtriser le processing des variables numériques pour l’algorithme SMOTE La structure des variables numériques est déterminante dans le fonctionnement du SMOTE. C’est pourquoi il faut traiter ces variables …