Construire un modèle de Machine Learning permettant de prédire les risques extrêmes et définir une équation tarifaire pour ces risques
Une part importante des charges d’un assureur vient d’événements rares mais extrêmement coûteux (incendies, accidents graves…). Du fait de leur rareté, il est très difficile de prédire ces événements.
Suréchantillonnage synthétique (SMOTE), Régression de Poisson pénalisée (LASSO), Random Forest, Arbres de régression de Poisson.
La principale difficulté de cette mission est que les sinistres graves sont rares. En conséquence, il existe peu de cas représentatifs dans la base d’entraînement (Train). Pour pouvoir entrainer correctement un modèle, il nous faut donc sur-échantillonner les cas minoritaires. Pour cela nous avons utilisé l’algorithme SMOTE (Synthetic Minority Over-sampling TEchnique) avant d’entraîner nos modèles de Machine Learning. Ces modèles ont permis de segmenter la population, mais aussi de sélectionner les variables importantes et d’identifier les interactions et non-linéarités à intégrer dans le modèle de tarification actuarielle.
Nous contacter :
07 81 74 98 26
contact@kobia.fr
© Kobia