Разработка Data Science-решения для финтех-сектора
Решение для сбора данных о продавцах на основе машинного обучения.
Содержание
Решение для сбора данных о продавцах на основе машинного обучения.
Клиент
Компания, специализирующаяся на сборе данных.
Проблема
Недостаток данных, который мешал привлечению релевантной аудитории и удержанию клиентов.
Решение
Приложение для обработки данных на базе технологии машинного обучения (ML) позволяет банкам извлекать ценные данные о продавцах для их дальнейшего анализа, что помогает разрабатывать более эффективную стратегию.
Задача
Команда LeverX участвовала в разработке решения для обработки данных, главная задача которого — предоставление европейским банкам подробной и систематизированной информации об использовании их продуктов —дебетовых и кредитных карт.
Необходимо было создать механизм, который бы автоматически выявлял ценную для банков информацию о продавцах на основе платежей их клиентов, а затем разбивал бы эти данные на категории.Таким образом, банк мог бы определить ключевых продавцов и получить представление о их клиентах и сопутствующих рисках.
Наша команда отвечала за создание алгоритмов ML, которые обеспечивали:
- Оценку URL-адреса продавца по разным критериям;
- Извлечение достоверной информации;
- Узнаваемость продукта;
- Классификацию сопутствующих рисков.
Процесс категоризации следовало построить с учетом списка категорий, предоставленного клиентом.
Еще одной задачей было оптимизировать процесс оценки URL таким образом, чтобы он был максимально приближен к выбору сайтов при поиске информации.
Как работает решение
Принцип работы решения:
- Клиент совершает покупку с помощью дебетовой или кредитной карты.
- Краткая информация о покупке (где она была совершена, как зовут продавца, код MCC и т.д.) поступает в банк.
- С банковского сервера информация поступает на сервер решения.
- Серверы просматривают информацию о продавце, чтобы с помощью ML определить, какие товары или услуги он предоставляет.
- В соответствии с извлеченными данными решение определяет связанные с продавцом категории и отправляет эту информацию в банк.
Технологический стек
Классификация продавцов
Gensim
Doc2Vec
TF-IDF
Logistic regression
Оценка URL
XGBoost
LightGBM
Log Regression
Optuna
Узнаваемость продукта
Default Python
Numpy
Результаты
Наша команда оперативно решала проблемы, возникающие в ходе разработки, в том числе связанные с некорректными URL-адресами и составлением списка товаров для распознавания системой, и предоставила решение, которое собирает важную для банков информацию о продавцах и их клиентах. Благодаря нему клиент может укрепить свои позиции на рынке поставщиков услуг по сбору данных, предлагая данную систему банкам для получения полезных сведений.
Больше проектов
СВЯЗАТЬСЯ С НАМИ
Что будет дальше?
-
1
Наши специалисты свяжутся с вами, чтобы детально обсудить ваши бизнес-цели и детали будущего проекта.
-
2
Мы подпишем соглашение о неразглашении, чтобы обеспечить безопасность ваших данных.
-
3
Наша команда подготовит индивидуальное проектное предложение с указанием объема, сроков и бюджета.
лет опыта
проектов
экспертов
СВЯЗАТЬСЯ С НАМИ