
Равиль Ахтямов
к.э.н., основатель Digital Economy Lab,
https://digitaleconomylab.ru/)
Ключевые слова: операционные риски, реколлы, машинное обучение, LLM, CatBoost, SHAP, XAI, верификация данных, БКИ, пост-трейд, ИИ-агент, финтех, сверка данных, автоматизация банкинга.
Введение: две головные боли финансового оператора
Современный банк работает в режиме цейтнота. С одной стороны, расчетные циклы сжимаются до T+1 и T+0, а объемы сделок неуклонно растут. С другой стороны, регулятор и клиенты требуют безупречного качества данных. Особенно это критично в сфере кредитных историй.
Две, казалось бы, разные задачи — пост-трейд обработка сделок и верификация записей в БКИ — имеют общую природу. По сути, это поиск и исправление расхождений между учетными системами.
Ручная обработка таких инцидентов — настоящий тормоз для бизнеса. Расследование одного реколла может занимать до 4 часов. Каждое расхождение с бюро кредитных историй требует 30–40 минут работы сотрудника. Человеческий ресурс не бесконечен, а цена ошибки постоянно растет.
В этой статье мы покажем, как современные методы машинного обучения и большие языковые модели (LLM) позволяют автоматизировать оба процесса. Мы также предложим конкретную дорожную карту для запуска пилотного проекта в вашей организации.
Пилот 1. Прогнозирование реколлов в пост-трейд обработке
Почему бэк-офис больше не справляется вручную
Реколлы — это расхождения между данными учетных систем, подтверждениями контрагентов и ожидаемыми параметрами сделки. Это классический операционный риск. Сегодня работа с ними — это преимущественно ручной труд высококвалифицированных сотрудников.
Мы разработали бинарный классификатор, который оценивает вероятность возникновения реколла для каждой сделки еще до наступления расчетной даты. Модель агрегирует данные из шести ключевых источников:
| Категория данных | Источники | Примеры признаков |
|---|---|---|
| Реестр сделок | Calypso и др. | ISIN, цена, количество, контрагент, тип сделки |
| Бухгалтерский учёт | ЦФТ, Диасофт | Счета Дт/Кт, даты проводок |
| Депозитарный учёт | НРД, Диасофт АРК | Счёт депо, тип позиции, код расчётов |
| Корпоративные действия | НРД | Тип события, дата отсечки |
| Внешние справочники | MOEX, СПАРК | VWAP, ликвидность, рейтинг контрагента |
| История реколлов | ServiceNow, Jira | Тип расхождения, время устранения |
Почему CatBoost?
Учитывая большое число категориальных признаков (контрагенты, ISIN, счета), мы выбрали CatBoostClassifier. Этот алгоритм из коробки работает с «категориями» без необходимости One-Hot Encoding и устойчив к переобучению. Инжиниринг признаков позволил получить более 50 факторов, включая:
- отклонение цены от VWAP;
- частоту реколлов у конкретного контрагента;
- расхождение дат валютирования;
- рыночную волатильность;
- временные паттерны (близость к концу квартала, корпоративным действиям).
Из-за сильного дисбаланса классов (реколлы составляют лишь ~5% сделок) мы применили взвешивание. Основная цель — максимизация полноты (Recall). Результаты на тестовой выборке:
- Recall = 0,87 (модель находит 87% реальных проблемных сделок);
- Precision = 0,21 (наблюдается много ложных срабатываний, но для бизнеса это приемлемо — лучше перепроверить лишнюю сделку, чем пропустить реальный риск).
Доверяй, но проверяй: объяснимость через SHAP
Для соответствия регуляторным требованиям в области объяснимого ИИ (XAI) мы используем библиотеку SHAP. Она позволяет понять, почему модель приняла то или иное решение.
Топ-5 факторов, влияющих на риск реколла:
- Отклонение цены от VWAP.
- Частота реколлов у контрагента.
- Расхождение дат валютирования.
- Волатильность рынка.
- Тип инструмента.
Пример из практики: Модель присвоила сделке высокий риск (Score = 0,92). SHAP-анализ показал, что главные причины — отклонение цены на 15% от рыночной и плохая история контрагента. Контролёр оперативно проверил сделку и нашел ошибку в расчетах еще до её реализации.
Пилот 2. LLM для верификации кредитных историй (АБС vs БКИ)
Та же логика применима к задаче сверки данных между автоматизированной банковской системой (АБС) и бюро кредитных историй (БКИ). Здесь мы используем LLM как интеллектуального «контролёра», который не только находит расхождения, но и классифицирует их для дальнейшего автоисправления.
Фреймворк для анализа ошибок БКИ
Мы адаптировали методологию улучшения данных под задачу верификации. Получился пятиэтапный фреймворк:
- Сбор данных — выгрузки из АБС и БКИ, журнал зафиксированных расхождений.
- Автоматическая оценка — сравнение записей по полноте, форматам, точности сумм, логике статусов.
- Анализ и сегментация — группировка ошибок по типам (форматные, справочные, суммовые, идентификационные, логические).
- Генерация исправлений — применение специализированных промптов для автоисправления выявленных ошибок.
- Валидация — повторная проверка исправленных данных и эскалация сложных случаев человеку.
Пример промпта для детектора расхождений:
Ты — эксперт по верификации кредитных историй. Сравни данные из АБС и БКИ.
Найди все несоответствия в полях: сумма кредита, остаток долга, дата выдачи, статус, паспортные данные.
Для каждого укажи критичность (высокая/низкая).
Данные АБС: {…}
Данные БКИ: {…}
Часть 3. ИИ-агент Reconciler: от детектива к автономному исполнителю
Объединив оба подхода, мы спроектировали ИИ-агента Reconciler. Это система, которая автономно обрабатывает расхождения между АБС и БКИ. В сложных случаях она не просто ставит задачу человеку, а подключает его с готовым решением.
Как работает агент (сквозной пример)
Представим ситуацию: По договору №12345 в АБС статус «активен» с датой 15.03.2024, а в БКИ — статус «закрыт» и дата 15/03/2024.
- Детектор находит два расхождения: критическое (статус) и форматное (дата).
- Классификатор направляет статус на проверку человеку, а дату — в блок автокоррекции.
- Исправитель (Fixer) приводит дату к единому формату «15.03.2024».
- Эскалатор формирует для оператора отчет:
«По договору №12345 выявлено расхождение статусов. В АБС — “активен”, в БКИ — “закрыт”. Скан договора подтверждает статус “активен”. Рекомендация: обновить запись в БКИ.» - Оператор утверждает решение, и агент отправляет корректировку в БКИ через API.
- Аудитор фиксирует все действия для регулятора.
Метрики эффективности (целевые)
Мы ставим перед собой амбициозные, но достижимые цели по автоматизации.
| Метрика | Цель |
|---|---|
| Autofix rate | >70% (форматные и справочные ошибки исправляются полностью автоматически) |
| HITL acceptance | >90% (операторы согласны с рекомендациями агента) |
| Time saving | >80% (сокращение времени обработки одного расхождения) |
| Recall (полнота) | >95% |
| Audit compliance | 100% |
Экономический эффект: от гипотезы к цифрам
Опираясь на лабораторные эксперименты и международные бенчмарки, мы оцениваем потенциальный эффект от внедрения предложенных решений следующим образом:
- Пост-трейд: сокращение времени расследования реколлов с 4 до 2 часов, снижение объема ручной проверки на 60%.
- Верификация БКИ: автоматизация 70% типовых расхождений, сокращение трудозатрат на 80%.
- Качество данных: значительное снижение количества претензий со стороны регулятора и клиентов.
Важно отметить: эти цифры будут уточнены в ходе пилотного проекта на реальных данных конкретного участника рынка.
Приглашение к пилотному проекту
Мы приглашаем 2–3 финансовые организации к проведению закрытого пилотного проекта по внедрению описанных решений.
Что получит участник пилота:
- Интеграцию модели прогнозирования реколлов или агента Reconciler в контур одного из выбранных бизнес-процессов.
- Детальный аудит текущего качества данных и выявление «узких мест».
- Настроенный пайплайн, адаптированный под ваши справочники и форматы данных.
- Итоговый отчет об эффективности с расчетом метрик Recall/Precision, Autofix rate и экономии времени.
Этапы пилота:
- Месяц 1: интеграция, сбор исторических данных, формирование golden set, калибровка моделей.
- Месяц 2: пилотная эксплуатация в фоновом режиме, сбор и анализ метрик.
- Месяц 3: подготовка отчета, презентация результатов, принятие решения о масштабировании.
Контакты
Для участия в пилоте или получения дополнительной информации заполните форму обратной связи на сайте Digital Economy Lab. Мы проведем предварительный созвон, чтобы выбрать наиболее подходящий для вас сценарий.
Вместо заключения: готовый промпт для первого шага
Если вы хотите уже сегодня оценить возможности LLM в поиске расхождений, скопируйте этот промпт в интерфейс любой современной модели (GPT, Claude, DeepSeek) и подставьте свои тестовые данные.
Ты — эксперт по верификации кредитных историй. Сравни данные из банковской АБС и данные, полученные из БКИ по одному договору.
Данные из АБС (JSON): {вставьте JSON}
Данные из БКИ (JSON): {вставьте JSON}Задачи:
- Найди все несоответствия в полях: сумма кредита, остаток долга, дата выдачи, статус договора, паспортные данные (серия, номер).
- Для каждого несоответствия укажи, является ли оно критическим (ошибка в суммах/идентификаторах) или некритическим (формат даты, регистр букв).
- Если расхождений нет, напиши “Ошибок не обнаружено”.
Результат предоставь в виде краткого маркированного списка.
Список источников:
- Clearstream. Settlement Prediction Tool.
- Coreledger-tech/Exception-handling-reconciliation. — GitHub.
- University of Zurich. AI-Enabled Solutions for Swiss Banking. — ZORA, 2025.
- AI Use in the Financial Sector — Final Report (Israel). — Lexology, 2025.
- ProtagoLabs. AI Agents for Financial Document Verification. — arXiv:2405.04294.
- Amazon Science. Multi-agent Framework for Root Cause Analysis. — 2025.
- FRED: Financial Error Detection and Correction. — 2026.







