main banner

Разработка Data Science-решения для финтех-сектора

Решение для сбора данных о продавцах на основе машинного обучения.

Содержание

Решение для сбора данных о продавцах на основе машинного обучения.

Клиент

Компания, специализирующаяся на сборе данных.

Проблема

Недостаток данных, который мешал привлечению релевантной аудитории и удержанию клиентов.

Решение

Приложение для обработки данных на базе технологии машинного обучения (ML) позволяет банкам извлекать ценные данные о продавцах для их дальнейшего анализа, что помогает разрабатывать более эффективную стратегию.

qkhd1jhg6okim1h7f729-1

Задача

Команда LeverX участвовала в разработке решения для обработки данных, главная задача которого — предоставление европейским банкам подробной и систематизированной информации об использовании их продуктов —дебетовых и кредитных карт.

Необходимо было создать механизм, который бы автоматически выявлял ценную для банков информацию о продавцах на основе платежей их клиентов, а затем разбивал бы эти данные на категории.Таким образом, банк мог бы определить ключевых продавцов и получить представление о их клиентах и сопутствующих рисках.

Наша команда отвечала за создание алгоритмов ML, которые обеспечивали:

  • Оценку URL-адреса продавца по разным критериям;
  • Извлечение достоверной информации;
  • Узнаваемость продукта;
  • Классификацию сопутствующих рисков.

Процесс категоризации следовало построить с учетом списка категорий, предоставленного клиентом.

Еще одной задачей было оптимизировать процесс оценки URL таким образом, чтобы он был максимально приближен к выбору сайтов при поиске информации.

data-science-sollution-1data-science-sollution-2data-science-sollution-3

Как работает решение

Принцип работы решения:

  1. Клиент совершает покупку с помощью дебетовой или кредитной карты.
  2. Краткая информация о покупке (где она была совершена, как зовут продавца, код MCC и т.д.) поступает в банк.
  3. С банковского сервера информация поступает на сервер решения.
  4. Серверы просматривают информацию о продавце, чтобы с помощью ML определить, какие товары или услуги он предоставляет.
  5. В соответствии с извлеченными данными решение определяет связанные с продавцом категории и отправляет эту информацию в банк.

Технологический стек

Классификация продавцов

Gensim

Doc2Vec

TF-IDF

Logistic regression

Оценка URL

XGBoost

LightGBM

Log Regression

Optuna

Узнаваемость продукта

Default Python

Numpy

Результаты

Наша команда оперативно решала проблемы, возникающие в ходе разработки, в том числе связанные с некорректными URL-адресами и составлением списка товаров для распознавания системой, и предоставила решение, которое собирает важную для банков информацию о продавцах и их клиентах. Благодаря нему клиент может укрепить свои позиции на рынке поставщиков услуг по сбору данных, предлагая данную систему банкам для получения полезных сведений.

Больше проектов