Альфа-банк тестирует графовые нейросети для прогнозирования дефолтов клиентов
Альфа-банк экспериментирует с графовыми нейронными сетями для оценки кредитных рисков физических лиц. Новый подход учитывает социальные связи клиентов, что может повысить точность прогнозирования дефолтов. Технология обрабатывает граф из 50 млн вершин и 500 млн рёбер, анализируя транзакции, реферальные программы и другие типы взаимодействий.
Команда прикладных исследований Альфа-банка разработала новый подход к оценке вероятности дефолта (PD) физических лиц, основанный на анализе социальных связей клиентов. В отличие от традиционных методов, рассматривающих каждого заёмщика изолированно, система использует графовые нейронные сети для учёта сложных взаимосвязей между клиентами. Экспериментальная модель обрабатывает граф, содержащий около 50 миллионов вершин и 500 миллионов рёбер, представляющих различные типы взаимодействий между людьми.
Для построения социального графа банк использует шесть типов связей: переводы между счетами, операции через Систему быстрых платежей, участие в реферальной программе, общие карты, совместные займы и связи по адресу. Каждое ребро графа характеризуется набором признаков, включая количество и размер транзакций, стандартное отклонение сумм переводов, давность связей и другие параметры. В качестве признаков вершин взяты готовые эмбеддинги нейросетевой модели, обученной на данных бюро кредитных историй.
Техническая реализация решения основана на архитектуре GATv2 (Graph Attention Network), которая позволяет модели учитывать не только характеристики отдельных узлов, но и топологию всего графа. Числовые признаки кодируются с помощью метода Piecewise-Linear Embeddings, обеспечивающего стабильную обработку больших объёмов данных. Такой подход сохраняет контекст связей и способен делать прогнозы даже при частичном отсутствии информации, восстанавливая недостающие данные из структуры графа.
Традиционные методы кредитного скоринга в банковской сфере обычно ограничиваются анализом табличных данных о каждом клиенте отдельно. Альфа-банк ранее использовал подход с агрегацией информации о ближайшем окружении заёмщика, но он имел существенные ограничения, включая потерю контекста при агрегировании и невозможность учёта кросс-канальных взаимодействий. Графовые нейросети позволяют преодолеть эти ограничения, хотя и требуют значительных вычислительных ресурсов для обработки таких объёмов данных.
Внедрение подобных технологий в российских банках может существенно изменить подходы к оценке кредитных рисков. Учёт социальных связей особенно актуален в условиях роста просроченной задолженности и необходимости более точного прогнозирования дефолтов. Однако масштабирование решения требует решения проблем с вычислительной нагрузкой и интеграцией с существующими банковскими системами. Дальнейшее развитие проекта предполагает тестирование различных комбинаций признаков и оптимизацию архитектуры нейросети для промышленной эксплуатации.
Сравнение с альтернативными подходами показывает, что графовые нейросети потенциально могут обеспечить более высокую точность прогнозирования по сравнению с традиционными методами машинного обучения, такими как градиентный бустинг или логистическая регрессия. Однако их внедрение сопряжено с дополнительными сложностями, включая необходимость обработки графов большого размера и интерпретируемость результатов. Банковский сектор только начинает осваивать подобные технологии, и их реальная эффективность будет ясна после более масштабных тестов.
Перспективы развития проекта включают расширение набора анализируемых связей, интеграцию дополнительных источников данных и оптимизацию вычислительных процессов. Важным направлением станет исследование того, как различные типы социальных взаимодействий влияют на кредитное поведение. Также предстоит решить вопросы, связанные с защитой персональных данных при обработке информации о связях между клиентами. Успешная реализация проекта может стать значительным шагом в развитии риск-менеджмента в российском банковском секторе.