Construire un modèle de Machine Learning permettant de prédire les risques extrêmes et définir une équation tarifaire pour ces risques
Une part importante des charges d’un assureur vient d’événements rares mais extrêmement coûteux (incendies, accidents graves…). Du fait de leur rareté, il est très difficile de prédire ces événements.
Suréchantillonnage synthétique (SMOTE), Régression de Poisson pénalisée (LASSO), Random Forest, Arbres de régression de Poisson.
La principale difficulté de cette mission est que les sinistres graves sont rares. En conséquence, il existe peu de cas représentatifs dans la base d’entraînement (Train). Pour pouvoir entrainer correctement notre modèle de Machine Learning, il nous faut donc sur-échantillonner les cas minoritaires. Pour cela nous avons utilisé l’algorithme SMOTE (Synthetic Minority Over-sampling TEchnique). Sur une base sur-échantillonnée, nous avons ensuite entraîné nos modèles de Machine Learning. Ces modèles ont permis de segmenter la population, mais aussi de sélectionner les variables et d’identifier les interactions et non-linéarités à intégrer dans le modèle de tarification actuarielle.
Nous contacter
06 75 07 62 45
contact@kobia.fr
© Kobia