main banner

Développement de solutions Data Science pour le secteur fintech

Solution de reconnaissance des commerçants basée sur le machine learning.

Table des matières:

Solution de reconnaissance des commerçants basée sur l'apprentissage automatique.

Client

Société de services de collecte de données.

Pénibilité

Insuffisance de données pour l'attraction de publics pertinents et le maintien du niveau souhaité de fidélisation des clients.

Solution

Application de science des données basée sur l'apprentissage automatique qui permet aux banques d'extraire des données précieuses sur les commerçants en vue d'une analyse plus approfondie, ce qui permet d'élaborer une stratégie plus solide.

Détails du projet

Emerline a été impliquée dans le développement d'une solution de science des données visant à fournir aux banques européennes des informations détaillées et catégorisées sur l'utilisation de leurs produits - cartes de débit et de crédit. L'objectif était d'établir un mécanisme qui détecterait automatiquement les informations utiles aux banques sur les commerçants en se basant sur les paiements des clients, puis de diviser ces données en catégories. De cette manière, une banque serait en mesure de déterminer ses principaux commerçants et d'obtenir des informations sur le comportement de leurs clients et les risques qui en découlent.

Notre équipe était responsable de la création des algorithmes de ML qui assureraient l'extraction des données suivantes :

  • notation de l'URL du commerçant sur la base de différents critères
  • Extraction d'informations valides
  • Reconnaissance des produits
  • Catégorisation des marchands en fonction des risques qui les accompagnent

Le processus de catégorisation devait être construit en fonction de la liste de catégories fournie par le client.

Un autre défi consistait à optimiser le processus de notation des URL de manière à ce qu'il se rapproche le plus possible de la manière dont les humains sélectionnent les sites web lorsqu'ils naviguent à la recherche d'informations.

Comment fonctionne la solution?

Le principe de fonctionnement de la solution fournie peut être décrit comme suit :

  1. Un client effectue un achat avec une carte de débit ou de crédit.
  2. De brèves informations sur l'achat (lieu, nom du commerçant, code MCC, etc.) sont envoyées à la banque.
  3. ) sont envoyées à la banque. Depuis un serveur bancaire, les informations sont transférées au serveur de la solution de science des données sur laquelle nous avons travaillé.
  4. Les serveurs recherchent les informations sur le commerçant pour définir - à l'aide de l'apprentissage automatique - les produits ou services qu'il fournit.
  5. En fonction des données extraites, la solution détermine les catégories liées au commerçant et envoie ces informations à la banque.

Technologies utilisées

CLASSIFICATION DES COMMERÇANTS

  • Gensim
  • Doc2vec
  • tf-idf
  • régression logistique

CLASSEMENT D'URL

  • XGBoost
  • LightGBM
  • Régression logarithmique
  • Optuna

RECONNAISSANCE DES PRODUITS

  • Python par défaut
  • Numpy

Résultats

En relevant rapidement les défis pendant le développement, y compris ceux liés aux URLs invalides, et en compilant une liste de produits pour la reconnaissance du système, notre équipe a fourni au client une solution bien pensée qui recueille des informations importantes sur les commerçants et le comportement des clients. Avec un tel système, le client peut renforcer sa position sur le marché des fournisseurs de services de collecte de données, en l'offrant aux banques qui peuvent l'utiliser pour extraire des informations utiles.

More Case Studies