Développement de solutions Data Science pour le secteur fintech
Solution de reconnaissance des commerçants basée sur le machine learning.
Table des matières:
Solution de reconnaissance des commerçants basée sur l'apprentissage automatique.
Client
Société de services de collecte de données.
Pénibilité
Insuffisance de données pour l'attraction de publics pertinents et le maintien du niveau souhaité de fidélisation des clients.
Solution
Application de science des données basée sur l'apprentissage automatique qui permet aux banques d'extraire des données précieuses sur les commerçants en vue d'une analyse plus approfondie, ce qui permet d'élaborer une stratégie plus solide.
Détails du projet
Emerline a été impliquée dans le développement d'une solution de science des données visant à fournir aux banques européennes des informations détaillées et catégorisées sur l'utilisation de leurs produits - cartes de débit et de crédit. L'objectif était d'établir un mécanisme qui détecterait automatiquement les informations utiles aux banques sur les commerçants en se basant sur les paiements des clients, puis de diviser ces données en catégories. De cette manière, une banque serait en mesure de déterminer ses principaux commerçants et d'obtenir des informations sur le comportement de leurs clients et les risques qui en découlent.
Notre équipe était responsable de la création des algorithmes de ML qui assureraient l'extraction des données suivantes :
- notation de l'URL du commerçant sur la base de différents critères
- Extraction d'informations valides
- Reconnaissance des produits
- Catégorisation des marchands en fonction des risques qui les accompagnent
Le processus de catégorisation devait être construit en fonction de la liste de catégories fournie par le client.
Un autre défi consistait à optimiser le processus de notation des URL de manière à ce qu'il se rapproche le plus possible de la manière dont les humains sélectionnent les sites web lorsqu'ils naviguent à la recherche d'informations.
Comment fonctionne la solution?
Le principe de fonctionnement de la solution fournie peut être décrit comme suit :
- Un client effectue un achat avec une carte de débit ou de crédit.
- De brèves informations sur l'achat (lieu, nom du commerçant, code MCC, etc.) sont envoyées à la banque.
- ) sont envoyées à la banque. Depuis un serveur bancaire, les informations sont transférées au serveur de la solution de science des données sur laquelle nous avons travaillé.
- Les serveurs recherchent les informations sur le commerçant pour définir - à l'aide de l'apprentissage automatique - les produits ou services qu'il fournit.
- En fonction des données extraites, la solution détermine les catégories liées au commerçant et envoie ces informations à la banque.
Technologies utilisées
CLASSIFICATION DES COMMERÇANTS
- Gensim
- Doc2vec
- tf-idf
- régression logistique
CLASSEMENT D'URL
- XGBoost
- LightGBM
- Régression logarithmique
- Optuna
RECONNAISSANCE DES PRODUITS
- Python par défaut
- Numpy
Résultats
En relevant rapidement les défis pendant le développement, y compris ceux liés aux URLs invalides, et en compilant une liste de produits pour la reconnaissance du système, notre équipe a fourni au client une solution bien pensée qui recueille des informations importantes sur les commerçants et le comportement des clients. Avec un tel système, le client peut renforcer sa position sur le marché des fournisseurs de services de collecte de données, en l'offrant aux banques qui peuvent l'utiliser pour extraire des informations utiles.
More Case Studies
Contact Us
What happens next?
-
1
An expert will reach out to you to discuss your specific needs and requirements.
-
2
We'll sign an NDA to ensure any sensitive information is kept secure and confidential.
-
3
We'll work with you to prepare a customized proposal based on the project's scope, timeline, and budget.
years of expertise
projects
professionals
Contact Us