Algorithmes prédictifs : une définition
Les algorithmes prédictifs sont utilisés pour la prédiction d’événements. Par exemple : qui va gagner la finale de la coupe du monde ? Pour effectuer une prédiction, l’algorithme combine :
- Un modèle mathématique
- Une grande quantité de données qui permet au modèle d’apprendre du passé pour faire des prédictions sur le futur.
Les prédictions se font sous forme de scores prédictifs traduisant soit une quantité attendue (ex : combien de buts va marquer l’équipe de France ?) soit une probabilité de survenance (ex : est-ce que l’équipe de France va gagner ?). Le calcul de ces scores se fait en tenant compte des différents types de données. Les algorithmes prédictifs sont utilisés dans le cadre général de l’analyse prédictive.
A quoi sert un algorithme prédictif ?
Les algorithmes prédictifs s’appuient par exemple sur des informations de santé afin de savoir si vous évoluez dans une population à risque. Une prédiction assez fine est ainsi donnée en fonction de votre personne. Selon votre âge, un algorithme prédictif peut déterminer les risques que vous développiez un cancer du poumon, du sein ou de la prostate. Les données mises en entrées vont concerner une diversité d’informations, notamment le régime alimentaire, que vous soyez fumeur ou non.
Quelques champs d’application
Les applications des algorithmes prédictifs sont nombreuses, en voici quelques exemples.
Le domaine de la santé
Les algorithmes prédictifs peuvent être appliqués dans de nombreux domaines. Ils sont notamment exploitables dans l’univers de la santé. En exploitant les informations médicales, il est plus facile d’établir un diagnostic de l’état de santé d’un patient et de faire une anticipation des risques éventuels.
La vente et le marketing
Le marketing prédictif connaît un développement majeur ces dernières années. Les recommandations faites aux clients sur Internet sont réalisées par des algorithmes prédictifs. Durant la navigation, une collecte de données sur l’internaute est réalisée, particulièrement son historique d’achats et de recherches. Selon ces informations, l’algorithme pourra identifier les besoins de ce dernier et lui proposer des produits susceptibles de l’intéresser. Les plateformes de diffusion de films utilisent cette technologie pour faire des recommandations à chacun de leurs utilisateurs, en tenant compte de leur historique de visionnage et de leurs goûts. Cela permet de personnaliser le service proposé en considérant les spécificités de chaque client.
Détection des fraudes
Les algorithmes prédictifs sont également utiles dans un contexte de détection des fraudes. L’utilisation de ces algorithmes rendant possible l’analyse de volumes de données importants permet de mieux détecter des fraudes que ce soit sur des données historiques ou bien en temps réel.Exemples d’algorithmes prédictifs
Il existe plusieurs types d’algorithmes prédictifs. En voici quelques exemples :
Les arbres de décision
Les arbres de décision sont des algorithmes permettant d’utiliser des règles simples pour effectuer une prédiction.
Le gradient boosting
Il permet le renforcement d’un modèle qui produit des prédictions, comme un arbre de décision. Par exemple, on a une base de données d’individus avec des informations sur leurs activités passées et sur leur démographie. L’âge de 50 % des personnes est connu et celui de l’autre moitié est inconnu. L’objectif est d’obtenir l’âge d’une personne faisant partie de la moitié inconnue selon ses activités (télévision, courses alimentaires, jeux vidéo…). Un arbre de décision est choisi en tant que modèle. Et comme la valeur à prédire est numérique, c’est un arbre de régression qui est retenu. Mais il peut, par exemple, prédire qu’un individu a 19 ans, alors qu’il en a 13 en réalité. Le gradient boosting intervient ici pour refaire un modèle tenant compte de l’écart entre la valeur prédite et la vraie valeur à prédire.
Les algorithmes génétiques
Ils sont basés sur le processus d’évolution génétique qui fait de l’Humain ce qu’il est. Les algorithmes génétiques sont le plus souvent utilisés lorsque l’on ne dispose pas d’observations de départ et que l’on voudrait qu’une machine apprenne au fur et à mesure de ses essais. Ils ne sont pas les plus efficaces pour résoudre un problème spécifique, mais ils donnent de bons résultats quand on les utilise pour traiter un ensemble de sous-problèmes, comme l’apprentissage de l’équilibre et la marche en robotique.
Les machines à vecteurs de support
Ce type d’algorithme de prédiction permet essentiellement de résoudre des problèmes de classification, même si une extension est faite pour toucher les problèmes de régression.
Les K plus proches voisins
C’est un algorithme de prédiction dont la compréhension est facile. Il s’agit essentiellement d’affecter à une observation la classe des K plus proches voisins. Mais le choix de K peut changer beaucoup de choses. C’est pourquoi il est important d’essayer plusieurs valeurs de K afin d’obtenir la séparation la plus intéressante.
Le clustering
Ce type d’algorithme de prédiction est utile lorsque les classes ne sont pas connues et qu’on souhaite classifier ou prédire une nouvelle observation alors qu’il n’y a pas de groupe prédéfini. Il assure un apprentissage non supervisé. Les algorithmes de clustering sont nombreux. En plus du très utilisé K-means, on peut citer en exemple DBSCAN et le clustering hiérarchique.
Conclusion
Les algorithmes prédictifs sont très nombreux et fonctionnent tous sur le même principe : analyser des données et faire des prédictions. Leur application est possible dans tous les domaines tant qu’il existe un minimum d’historique de données.