Historiquement, pour élaborer leurs modèles, les outils de datamining partent du principe que les individus restent indépendants.

Historiquement, pour élaborer leurs modèles, les outils de datamining partent du principe que les individus restent indépendants. Autrement dit, ils n’interagissent pas. Or, on le sait, les groupes d’influence existent. Et c’est précisément cette influence que KXEN cherche à mesurer avec son nouveau module KSN. Celui-ci caractérise les individus d’après les personnes ou les groupes qui les entourent. Objectif : enrichir le nombre de variables (c’est-à-dire de colonnes) qui serviront dans un deuxième temps à concevoir le modèle.

Une matrice visualisable sous forme de graphique

Pour un opérateur télécoms, il s’agira de déterminer qui appelle qui, l’âge des appelants, leur type de forfaits ou de mobiles. “ Ces interactions entre communautés de consommateurs sont calculées à la volée dans la mémoire de notre serveur. Elles sont représentées dans une immense matrice qui, pour chaque individu ou chaque ligne, permet de générer de nouvelles colonnes ”, détaille Roger Hadad, PDG et fondateur de KXEN.

Parmi ces innombrables croisements, le préparateur de données sélectionne les variables les plus parlantes. “ Pour cela, nous fournissons une représentation graphique de notre matrice. L’utilisateur navigue via les noyaux pour isoler les communautés en lien avec sa question ”, précise Hervé Kauffmann, responsable des ventes.

Ce module KSN fait écho à celui lancé en 2008 par KXEN ? KTC (KXEN Text Coding) ? qui, lui aussi, vise à augmenter le nombre de variables. Sa fonction : ramener sous une forme canonique les variations d’un même mot. Cette opération (la lemmatisation) isole des termes qui ont une forte valeur prédictive. KXEN s’est ainsi aperçu que l’occurrence du mot “ arbre ” dans une déclaration d’accident de voiture augmentait la probabilité de fraude à l’assurance…

Caractéristiques

Datamining.
Produit : KXEN Social Network (KSN).

Module d’analyse de réseau social embarqué dans K2C, la plateforme de datamining de KXEN. Précisément la V5, optimisée pour les processeurs 64 bits.

A partir de 50 000 euros, en fonction du nombre de clients stockés dans la base de données.

Social Network Analysis de SAS.