Secu
Une base graphe contre les fraudeurs chez BNP Paribas Personal Finance
Par Marie Varandat, publié le 07 juin 2023
L’établissement bancaire a exploité son historique de données avec la base graphe Neo4J pour détecter des liens indirects entre ses anciens dossiers : BNP Paribas Personal Finance a ainsi pu mettre en place un modèle prédictif et probabiliste qui aide à détecter les fraudeurs en temps réel.
Implantée dans de nombreux pays, dont la France, avec des marques comme Cetelem, la branche du crédit à la consommation du groupe BNP Paribas innove régulièrement pour proposer à ses partenaires commerciaux de nouveaux produits. Le paiement fractionné en trois ou quatre fois sur les sites d’e-commerce en fait partie. Son succès soulève de nouveaux enjeux de sécurité, ainsi que le souligne Mehdi Barchouchi, responsable Innovation Data & Outils de la Direction des Risques France chez BNP Paribas Personal Finance : « Le paiement fractionné repose sur un process très rapide avec peu de données collectées auprès du client. Ne relevant pas de la loi sur le crédit à la consommation, le remboursement étant effectué dans un délai inférieur à 90 jours, la fourniture de justificatifs n’est pas requise. L’enjeu, quand on propose ce genre de produit, est de ne pas pénaliser l’expérience client grâce à un processus aussi rapide que possible, affranchi des traditionnelles étapes de vérifications bancaires et d’identité. Dès lors, ce type de paiement est plus sujet à la fraude. Il suppose de nouveaux moyens de lutte. »
Capitaliser sur les données existantes pour établir des patterns
Les systèmes de détection de fraude traditionnels établissent des liens directs entre les données, telle l’identification d’un nom figurant sur une blacklist. En l’absence de justificatif, le procédé est inefficace : rien de plus simple qu’un changement de nom pour contourner le système. C’est pourquoi BNP Paribas Personal Finance a opté pour une approche basée sur un score de risque.

Un risque accru de fraude potentielle est détecté avant l’étape d’acceptation du contrat de paiement fractionné.
Établie à partir de la combinaison d’une multitude de facteurs, cette approche essaie de détecter des liens indirects entre d’anciens et de nouveaux dossiers en s’appuyant sur les traces laissées par les fraudeurs. Typiquement, deux dossiers peuvent n’avoir aucune information en commun, mais en approfondissant le sujet, on constate qu’ils partagent une même information avec un troisième. « Le scoring fonctionne sur un mode prédictif et probabiliste partant du principe que le fait que je sois relié de près ou de loin à une communauté de fraudeurs augmente énormément mes chances d’être moi-même un fraudeur », précise Mehdi Barchouchi.

Mehdi Barchouchi,
Responsable innovation data & outils de la Direction des Risques France chez BNP Paribas Personal Finance
« Nous avons utilisé la technologie Neo4J pour réaliser nos tests et les résultats ont été tellement bons que nous l’avons gardée pour le passage en production. »
Dans un premier temps, la branche crédit s’est appuyée sur les données stockées dans ses bases relationnelles pour détecter de potentiels liens entre ses anciens dossiers et identifier des modes opératoires. « Le temps n’était pas une contrainte pendant la phase d’étude et certaines requêtes SQL mettaient des heures à s’exécuter compte tenu de la multiplicité des facteurs à prendre en compte. Mais pour faire de la détection en temps réel, la base relationnelle n’était clairement pas la bonne technologie. »
Combiner base graphe et ML pour anticiper les risques de fraude
La connaissance acquise (patterns de fraudes) pendant cette première phase a donc été transposée dans une base graphe, plus performante sur les requêtes cherchant des liens entre de gros volumes de données. « Quand nous avons débuté, les acteurs n’étaient pas nombreux et Neo4J avait le plus de notoriété. Nous avons donc utilisé cette technologie pour réaliser nos tests et les résultats ont été tellement bons que nous l’avons gardée pour le passage en production ».
En appui sur des outils internes, BNP Paribas Personal Finance a développé un modèle de machine learning (ML) qui utilise les données de la base pour calculer la probabilité de fraude : pour chaque nouvelle demande de paiement fractionné, il attribue un score de risque qui guide ensuite la prise de décision. Grâce à ce modèle, l’établissement bancaire est beaucoup plus réactif ainsi que l’explique Edouard Tabary, responsable de l’équipe innovation et data science au centre de scoring BNP Paribas Personal Finance : « Il faut généralement attendre le second paiement, soit un mois après l’acception du dossier, pour savoir que le client est un mauvais payeur avec les moyens traditionnels. Grâce au modèle ML, nous sommes aujourd’hui en mesure de prédire les comportements, et donc de détecter de potentielles fraudes avant d’accepter le contrat. »

Pour mettre en place son système, BNP Paribas Personal Finance a mené de nombreuses expérimentations afin de vérifier la valeur des liens indirects dans la lutte contre la fraude.
Un système évolutif qui a déjà permis d’éliminer 30 % des fraudes
Le projet est passé en production début 2022. Aujourd’hui, BNP Paribas Personal Finance combine détection traditionnelle et détection basée sur les liens indirects dans un même processus. Plus efficiente, cette vérification enrichie du score de risque a permis de réduire significativement la fraude. « En refusant 2 % du volume des demandes reçues, nous arrivons à capter 30 % de la fraude, preuve que notre dispositif est efficace », se félicite Edouard Tabary.
LE PROJET EN CHIFFRES
150 partenaires commerciaux concernés (paiements fractionnés)
30 % de réduction des fraudes
4 ans, la durée du projet avant le passage en production
L’ENTREPRISE BNP PARIBAS PERSONAL FINANCE
Activité : Établissement bancaire
Effectif : 20 000 collaborateurs
Produit net bancaire : 5,2 Md€
À LIRE AUSSI :
