Qu’est-ce que les algorithmes prédictifs ?

Les algorithmes prédictifs sont des modèles mathématiques conçus pour anticiper les résultats futurs les plus sûrs en tenant compte des résultats survenus. Ils permettent d’obtenir des scores prédictifs traduisant la probabilité de répondre favorablement à une requête.

25 août 2021

Algorithmes prédictifs : une définition

Les algorithmes prédictifs sont utilisés pour la prédiction d’événements. Par exemple : qui va gagner la finale de la coupe du monde ? Pour effectuer une prédiction, l’algorithme combine :

Un modèle mathématique
Une grande quantité de données qui permet au modèle d’apprendre du passé pour faire des prédictions sur le futur.

Les prédictions se font sous forme de scores prédictifs traduisant soit une quantité attendue (ex : combien de buts va marquer l’équipe de France ?) soit une probabilité de survenance (ex : est-ce que l’équipe de France va gagner ?). Le calcul de ces scores se fait en tenant compte des différents types de données. Les algorithmes prédictifs sont utilisés dans le cadre général de l’analyse prédictive.

A quoi sert un algorithme prédictif ?

Les algorithmes prédictifs s’appuient par exemple sur des informations de santé afin de savoir si vous évoluez dans une population à risque. Une prédiction assez fine est ainsi donnée en fonction de votre personne. Selon votre âge, un algorithme prédictif peut déterminer les risques que vous développiez un cancer du poumon, du sein ou de la prostate. Les données mises en entrées vont concerner une diversité d’informations, notamment le régime alimentaire, que vous soyez fumeur ou non.

Quelques champs d’application

Les applications des algorithmes prédictifs sont nombreuses, en voici quelques exemples.

Le domaine de la santé

Les algorithmes prédictifs peuvent être appliqués dans de nombreux domaines. Ils sont notamment exploitables dans l’univers de la santé. En exploitant les informations médicales, il est plus facile d’établir un diagnostic de l’état de santé d’un patient et de faire une anticipation des risques éventuels.

La vente et le marketing

Le marketing prédictif connaît un développement majeur ces dernières années. Les recommandations faites aux clients sur Internet sont réalisées par des algorithmes prédictifs. Durant la navigation, une collecte de données sur l’internaute est réalisée, particulièrement son historique d’achats et de recherches. Selon ces informations, l’algorithme pourra identifier les besoins de ce dernier et lui proposer des produits susceptibles de l’intéresser. Les plateformes de diffusion de films utilisent cette technologie pour faire des recommandations à chacun de leurs utilisateurs, en tenant compte de leur historique de visionnage et de leurs goûts. Cela permet de personnaliser le service proposé en considérant les spécificités de chaque client.

Détection des fraudes

Les algorithmes prédictifs sont également utiles dans un contexte de détection des fraudes. L’utilisation de ces algorithmes rendant possible l’analyse de volumes de données importants permet de mieux détecter des fraudes que ce soit sur des données historiques ou bien en temps réel.Exemples d’algorithmes prédictifs

Il existe plusieurs types d’algorithmes prédictifs. En voici quelques exemples :

Les arbres de décision

Les arbres de décision sont des algorithmes permettant d’utiliser des règles simples pour effectuer une prédiction.

Le gradient boosting

Il permet le renforcement d’un modèle qui produit des prédictions, comme un arbre de décision. Par exemple, on a une base de données d’individus avec des informations sur leurs activités passées et sur leur démographie. L’âge de 50 % des personnes est connu et celui de l’autre moitié est inconnu. L’objectif est d’obtenir l’âge d’une personne faisant partie de la moitié inconnue selon ses activités (télévision, courses alimentaires, jeux vidéo…). Un arbre de décision est choisi en tant que modèle. Et comme la valeur à prédire est numérique, c’est un arbre de régression qui est retenu. Mais il peut, par exemple, prédire qu’un individu a 19 ans, alors qu’il en a 13 en réalité. Le gradient boosting intervient ici pour refaire un modèle tenant compte de l’écart entre la valeur prédite et la vraie valeur à prédire.

Les algorithmes génétiques

Ils sont basés sur le processus d’évolution génétique qui fait de l’Humain ce qu’il est. Les algorithmes génétiques sont le plus souvent utilisés lorsque l’on ne dispose pas d’observations de départ et que l’on voudrait qu’une machine apprenne au fur et à mesure de ses essais. Ils ne sont pas les plus efficaces pour résoudre un problème spécifique, mais ils donnent de bons résultats quand on les utilise pour traiter un ensemble de sous-problèmes, comme l’apprentissage de l’équilibre et la marche en robotique.

Les machines à vecteurs de support

Ce type d’algorithme de prédiction permet essentiellement de résoudre des problèmes de classification, même si une extension est faite pour toucher les problèmes de régression.

Les K plus proches voisins

C’est un algorithme de prédiction dont la compréhension est facile. Il s’agit essentiellement d’affecter à une observation la classe des K plus proches voisins. Mais le choix de K peut changer beaucoup de choses. C’est pourquoi il est important d’essayer plusieurs valeurs de K afin d’obtenir la séparation la plus intéressante.

Le clustering

Ce type d’algorithme de prédiction est utile lorsque les classes ne sont pas connues et qu’on souhaite classifier ou prédire une nouvelle observation alors qu’il n’y a pas de groupe prédéfini. Il assure un apprentissage non supervisé. Les algorithmes de clustering sont nombreux. En plus du très utilisé K-means, on peut citer en exemple DBSCAN et le clustering hiérarchique.

Conclusion

Les algorithmes prédictifs sont très nombreux et fonctionnent tous sur le même principe : analyser des données et faire des prédictions. Leur application est possible dans tous les domaines tant qu’il existe un minimum d’historique de données.

Voir aussi

Analyse prédictive

Voir aussi

Introduction au Machine Learning

Qu’est-ce que le MLOps ?

Comment déployer en production des modèles de Machine Learning de façon fiable, efficace et...

Machine Learning Avancé

Coefficient de détermination, R2 score

Le R2 score, également appelé R-squared, R-carré ou Coefficient de détermination, est une...

Qu’est-ce que les algorithmes prédictifs ?

Algorithmes prédictifs : une définition

A quoi sert un algorithme prédictif ?

Quelques champs d’application

Le domaine de la santé

La vente et le marketing

Détection des fraudes

Les arbres de décision

Le gradient boosting

Les algorithmes génétiques

Les machines à vecteurs de support

Les K plus proches voisins

Le clustering

Conclusion

En quoi consiste l’analyse prescriptive ?

Qu’est-ce qu’un modèle prédictif ?

Qu’est-ce que le marketing prédictif ?

Qu’est-ce que l’analyse prédictive ?

Voir aussi

Qu’est-ce que le MLOps ?

Coefficient de détermination, R2 score

Laisser un commentaire Annuler la réponse