Схема работы ИИ-агента Reconciler для сверки данных АБС и БКИ

Операционные риски под контролем ИИ: от прогнозирования реколлов до умного агента для сверки данных

Равиль Ахтямов
к.э.н., основатель Digital Economy Lab,
https://digitaleconomylab.ru/)

Ключевые слова: операционные риски, реколлы, машинное обучение, LLM, CatBoost, SHAP, XAI, верификация данных, БКИ, пост-трейд, ИИ-агент, финтех, сверка данных, автоматизация банкинга.

Введение: две головные боли финансового оператора

Современный банк работает в режиме цейтнота. С одной стороны, расчетные циклы сжимаются до T+1 и T+0, а объемы сделок неуклонно растут. С другой стороны, регулятор и клиенты требуют безупречного качества данных. Особенно это критично в сфере кредитных историй.

Две, казалось бы, разные задачи — пост-трейд обработка сделок и верификация записей в БКИ — имеют общую природу. По сути, это поиск и исправление расхождений между учетными системами.

Ручная обработка таких инцидентов — настоящий тормоз для бизнеса. Расследование одного реколла может занимать до 4 часов. Каждое расхождение с бюро кредитных историй требует 30–40 минут работы сотрудника. Человеческий ресурс не бесконечен, а цена ошибки постоянно растет.

В этой статье мы покажем, как современные методы машинного обучения и большие языковые модели (LLM) позволяют автоматизировать оба процесса. Мы также предложим конкретную дорожную карту для запуска пилотного проекта в вашей организации.

Пилот 1. Прогнозирование реколлов в пост-трейд обработке

Почему бэк-офис больше не справляется вручную

Реколлы — это расхождения между данными учетных систем, подтверждениями контрагентов и ожидаемыми параметрами сделки. Это классический операционный риск. Сегодня работа с ними — это преимущественно ручной труд высококвалифицированных сотрудников.

Мы разработали бинарный классификатор, который оценивает вероятность возникновения реколла для каждой сделки еще до наступления расчетной даты. Модель агрегирует данные из шести ключевых источников:

Категория данных Источники Примеры признаков
Реестр сделок Calypso и др. ISIN, цена, количество, контрагент, тип сделки
Бухгалтерский учёт ЦФТ, Диасофт Счета Дт/Кт, даты проводок
Депозитарный учёт НРД, Диасофт АРК Счёт депо, тип позиции, код расчётов
Корпоративные действия НРД Тип события, дата отсечки
Внешние справочники MOEX, СПАРК VWAP, ликвидность, рейтинг контрагента
История реколлов ServiceNow, Jira Тип расхождения, время устранения

Почему CatBoost?

Учитывая большое число категориальных признаков (контрагенты, ISIN, счета), мы выбрали CatBoostClassifier. Этот алгоритм из коробки работает с «категориями» без необходимости One-Hot Encoding и устойчив к переобучению. Инжиниринг признаков позволил получить более 50 факторов, включая:

  • отклонение цены от VWAP;
  • частоту реколлов у конкретного контрагента;
  • расхождение дат валютирования;
  • рыночную волатильность;
  • временные паттерны (близость к концу квартала, корпоративным действиям).

Из-за сильного дисбаланса классов (реколлы составляют лишь ~5% сделок) мы применили взвешивание. Основная цель — максимизация полноты (Recall). Результаты на тестовой выборке:

  • Recall = 0,87 (модель находит 87% реальных проблемных сделок);
  • Precision = 0,21 (наблюдается много ложных срабатываний, но для бизнеса это приемлемо — лучше перепроверить лишнюю сделку, чем пропустить реальный риск).

Доверяй, но проверяй: объяснимость через SHAP

Для соответствия регуляторным требованиям в области объяснимого ИИ (XAI) мы используем библиотеку SHAP. Она позволяет понять, почему модель приняла то или иное решение.

Топ-5 факторов, влияющих на риск реколла:

  1. Отклонение цены от VWAP.
  2. Частота реколлов у контрагента.
  3. Расхождение дат валютирования.
  4. Волатильность рынка.
  5. Тип инструмента.

Пример из практики: Модель присвоила сделке высокий риск (Score = 0,92). SHAP-анализ показал, что главные причины — отклонение цены на 15% от рыночной и плохая история контрагента. Контролёр оперативно проверил сделку и нашел ошибку в расчетах еще до её реализации.

Пилот 2. LLM для верификации кредитных историй (АБС vs БКИ)

Та же логика применима к задаче сверки данных между автоматизированной банковской системой (АБС) и бюро кредитных историй (БКИ). Здесь мы используем LLM как интеллектуального «контролёра», который не только находит расхождения, но и классифицирует их для дальнейшего автоисправления.

Фреймворк для анализа ошибок БКИ

Мы адаптировали методологию улучшения данных под задачу верификации. Получился пятиэтапный фреймворк:

  1. Сбор данных — выгрузки из АБС и БКИ, журнал зафиксированных расхождений.
  2. Автоматическая оценка — сравнение записей по полноте, форматам, точности сумм, логике статусов.
  3. Анализ и сегментация — группировка ошибок по типам (форматные, справочные, суммовые, идентификационные, логические).
  4. Генерация исправлений — применение специализированных промптов для автоисправления выявленных ошибок.
  5. Валидация — повторная проверка исправленных данных и эскалация сложных случаев человеку.

Пример промпта для детектора расхождений:

Ты — эксперт по верификации кредитных историй. Сравни данные из АБС и БКИ.
Найди все несоответствия в полях: сумма кредита, остаток долга, дата выдачи, статус, паспортные данные.
Для каждого укажи критичность (высокая/низкая).
Данные АБС: {…}
Данные БКИ: {…}

Часть 3. ИИ-агент Reconciler: от детектива к автономному исполнителю

Объединив оба подхода, мы спроектировали ИИ-агента Reconciler. Это система, которая автономно обрабатывает расхождения между АБС и БКИ. В сложных случаях она не просто ставит задачу человеку, а подключает его с готовым решением.

Как работает агент (сквозной пример)

Представим ситуацию: По договору №12345 в АБС статус «активен» с датой 15.03.2024, а в БКИ — статус «закрыт» и дата 15/03/2024.

  1. Детектор находит два расхождения: критическое (статус) и форматное (дата).
  2. Классификатор направляет статус на проверку человеку, а дату — в блок автокоррекции.
  3. Исправитель (Fixer) приводит дату к единому формату «15.03.2024».
  4. Эскалатор формирует для оператора отчет:
    «По договору №12345 выявлено расхождение статусов. В АБС — “активен”, в БКИ — “закрыт”. Скан договора подтверждает статус “активен”. Рекомендация: обновить запись в БКИ.»
  5. Оператор утверждает решение, и агент отправляет корректировку в БКИ через API.
  6. Аудитор фиксирует все действия для регулятора.

Метрики эффективности (целевые)

Мы ставим перед собой амбициозные, но достижимые цели по автоматизации.

Метрика Цель
Autofix rate >70% (форматные и справочные ошибки исправляются полностью автоматически)
HITL acceptance >90% (операторы согласны с рекомендациями агента)
Time saving >80% (сокращение времени обработки одного расхождения)
Recall (полнота) >95%
Audit compliance 100%

Экономический эффект: от гипотезы к цифрам

Опираясь на лабораторные эксперименты и международные бенчмарки, мы оцениваем потенциальный эффект от внедрения предложенных решений следующим образом:

  • Пост-трейд: сокращение времени расследования реколлов с 4 до 2 часов, снижение объема ручной проверки на 60%.
  • Верификация БКИ: автоматизация 70% типовых расхождений, сокращение трудозатрат на 80%.
  • Качество данных: значительное снижение количества претензий со стороны регулятора и клиентов.

Важно отметить: эти цифры будут уточнены в ходе пилотного проекта на реальных данных конкретного участника рынка.

Приглашение к пилотному проекту

Мы приглашаем 2–3 финансовые организации к проведению закрытого пилотного проекта по внедрению описанных решений.

Что получит участник пилота:

  1. Интеграцию модели прогнозирования реколлов или агента Reconciler в контур одного из выбранных бизнес-процессов.
  2. Детальный аудит текущего качества данных и выявление «узких мест».
  3. Настроенный пайплайн, адаптированный под ваши справочники и форматы данных.
  4. Итоговый отчет об эффективности с расчетом метрик Recall/Precision, Autofix rate и экономии времени.

Этапы пилота:

  • Месяц 1: интеграция, сбор исторических данных, формирование golden set, калибровка моделей.
  • Месяц 2: пилотная эксплуатация в фоновом режиме, сбор и анализ метрик.
  • Месяц 3: подготовка отчета, презентация результатов, принятие решения о масштабировании.

Контакты

Для участия в пилоте или получения дополнительной информации заполните форму обратной связи на сайте Digital Economy Lab. Мы проведем предварительный созвон, чтобы выбрать наиболее подходящий для вас сценарий.

Вместо заключения: готовый промпт для первого шага

Если вы хотите уже сегодня оценить возможности LLM в поиске расхождений, скопируйте этот промпт в интерфейс любой современной модели (GPT, Claude, DeepSeek) и подставьте свои тестовые данные.

Ты — эксперт по верификации кредитных историй. Сравни данные из банковской АБС и данные, полученные из БКИ по одному договору.
Данные из АБС (JSON): {вставьте JSON}
Данные из БКИ (JSON): {вставьте JSON}

Задачи:

  1. Найди все несоответствия в полях: сумма кредита, остаток долга, дата выдачи, статус договора, паспортные данные (серия, номер).
  2. Для каждого несоответствия укажи, является ли оно критическим (ошибка в суммах/идентификаторах) или некритическим (формат даты, регистр букв).
  3. Если расхождений нет, напиши “Ошибок не обнаружено”.
    Результат предоставь в виде краткого маркированного списка.

Список источников:

  1. Clearstream. Settlement Prediction Tool.
  2. Coreledger-tech/Exception-handling-reconciliation. — GitHub.
  3. University of Zurich. AI-Enabled Solutions for Swiss Banking. — ZORA, 2025.
  4. AI Use in the Financial Sector — Final Report (Israel). — Lexology, 2025.
  5. ProtagoLabs. AI Agents for Financial Document Verification. — arXiv:2405.04294.
  6. Amazon Science. Multi-agent Framework for Root Cause Analysis. — 2025.
  7. FRED: Financial Error Detection and Correction. — 2026.