Anticiper le comportement à long terme

Nous avons repensé l’extraction et la transformation de nos données, et amélioré nos prédictions grâce au Machine Learning. Par cet investissement dans la durée, nous espérons parvenir à fiabiliser nos prévisions tout en simplifiant notre approche.

Pascale Blanchard
Responsable actuariat produits Epargne et Retraite, Crédit Agricole

Objectif

Définir et implémenter une nouvelle segmentation client qui permette de prédire précisément le comportement des épargnants sur le long terme et conduise à des estimations d’encours plus précises.

Contexte

Du fait d’événements personnels ou de la conjoncture économique, les épargnants peuvent retirer tout ou partie de leur épargne. Il est essentiel de prévoir ces comportements pour assurer la stabilité financière de l’assureur dans le contexte réglementaire Solvabilité II.

Résultats

  • +40% de précision sur l’estimation des encours futurs,
  • Gain de temps important pour les équipes d’actuariat grâce à une méthode de calibrage simplifiée.

Algorithmes

Rééchantillonnage, Gradient Boosting, Optimisation bayésienne, Valeurs de Shapley.

Méthode

Nous avons audité la vision Client actuelle et l’historique des flux financiers, puis intégré avec des données internes pour une vision 360°. Nous avons ensuite mis en oeuvre un pipeline de rééchantillonnage pour alimenter un modèle de Gradient Boosting (XGBoost). Ce pipeline a été optimisé sous contrainte de variance, selon une approche bayésienne pour limiter le temps de calcul. Après avoir validé la stabilité temporelle du modèle, nous l’avons interprété par la méthode des valeurs de Shapley, et défini des segmentations possibles du portefeuille à partir des effets identifiés.
Pour évaluer chaque segmentation, nous avons conçu un algorithme réplicatif rapide permettant un calibrage des taux et une projection des encours à long terme.

Les valeurs de Shapley permettent d’analyser la contribution d’une variable explicative aux prédictions du modèle. Cette contribution varie selon la valeur que prend la variable. On observe par exemple qu’avoir plus de 65 ans réduit fortement la probabilité de retirer son épargne. Ces analyses permettent d’identifier les zones de stabilité pour une segmentation appropriée dans les modèles financiers. (Image reproduite à partir de données open source pour préserver la confidentialité des données réelles.)