«Ингосстрах» внедрил платформу управления жизненным циклом ИИ-моделей на базе решений Data Ocean Nova и Kolmogorov AI вендора Data Sapience совместно с GlowByte

В «Ингосстрахе» создана единая корпоративная среда для разработки, внедрения и сопровождения моделей машинного обучения и искусственного интеллекта. Процесс перехода модели от стадии гипотезы к промышленной эксплуатации существенно ускорился благодаря унификации и автоматизации конвейеров данных (пайплайнов). Интегратором выступил GlowByte. Проект позволил устранить разрыв между специалистами по исследованию данных и инженерами данных, объединив их в общем цифровом пространстве на базе платформы Kolmogorov AI и Lakehouse-платформы Data Ocean Nova вендора Data Sapience. Об этом CNews сообщил представитель Data Sapience.
До старта проекта разработка моделей оставалась неунифицированной. Так как внутренняя платформа была закрытой, специалисты вынужденно внедряли собственные разрозненные подходы, что делало поддержку и развитие продуктов трудозатратными. Версионирование наборов данных (датасетов) отсутствовало, а использование персональных данных создавало риски нарушения нормативных требований и сдерживало масштабирование.
Кроме того, специалисты конкурировали за вычислительные мощности: высокая загрузка замедляла эксперименты, а горизонтальное масштабирование было фактически недоступно. При этом число моделей и нагрузка на команду продолжали расти.

Трансформация подходов к науке о данных (Data Science) началась со стандартизации инструментов разработки и обеспечения гибкого доступа к вычислительным ресурсам. Для прекращения обособленной работы на локальном оборудовании команда проекта внедрила масштабируемую архитектуру. Это позволило не только типизировать поддержку существующих решений, но и подготовить фундамент для быстрого запуска новых ИИ-сервисов. Автоматизация рутинных задач инженеров при развертывании и эксплуатации моделей сократила издержки на ИТ-инфраструктуру. Убытки минимизировались благодаря быстрому переносу моделей (скоринг, оценка рисков, персонализация) в исполнительную среду. Бизнес стал быстрее зарабатывать на аналитике.

Открытая архитектура позволяет наращивать мощности без потери производительности, что критически важно для обработки растущих объемов больших данных (Big Data) и развития направления больших языковых моделей (LLM). Платформа закладывает основу для новых потоков выручки за счет расширения предиктивной аналитики и сверхточной персонализации. В основе новой ИТ-архитектуры лежит тесная интеграция платформы аналитики данных, сопровождения моделей машинного обучения (MLOps) Kolmogorov AI и универсальной Lakehouse-платформы Data Ocean Nova вендора Data Sapience. Это создает бесшовную среду для всех этапов работы с данными и моделями.

Продукт Kolmogorov Continuity выступает «дирижером», автоматизируя сквозной процесс: от запроса бизнес-пользователя до вывода модели из эксплуатации (model management). Это обеспечивает полную прозрачность жизненного цикла моделей. Kolmogorov A2P автоматизирует продуктивизацию моделей. Если раньше это требовало глубокого участия ИТ-специалистов, то теперь процесс происходит в стандартизированном конвейере, что и дает основной прирост в скорости. Модуль Kolmogorov Axiom позволил создать единый каталог переменных (фичей). Команды теперь могут повторно использовать наработанные параметры вместо создания с нуля, что ускоряет разработку и повышает качество продуктов.

Проект решает системную проблему «разрыва» между наукой о данных и продуктивной средой, характерную для многих крупных компаний. Теперь бизнес получает работающие инструменты (например, модели скоринга или расчет ожидаемых убытков) не через месяцы, а в максимально сжатые сроки, что повышает оперативность принятия решений. Разработчики и аналитики могут сосредоточиться на разработке и улучшении алгоритмов, а не на решении инфраструктурных задач, работая с данными в едином контуре. Вместо разрозненного набора инструментов и теневых ИИ-сервисов компания получила единое окно, соответствующее требованиям информационной безопасности и реестру отечественного ПО.

Команда уже переводит действующие модели на современный технологический стек — данные, артефакты и конвейеры переносятся в единую управляемую среду с полноценным контролем версий и мониторингом. Время развертывания новых сервисов машинного обучения сократилось в несколько раз. Обеспечена бесперебойная работа десятков моделей в промышленной среде, охватывающих ключевые направления: от расчета финансовых показателей до маркетинговой персонализации и страхового скоринга.

По итогам проекта был создан центр компетенций. Совместная работа «Ингосстраха» с интегратором GlowByte и вендором Data Sapience переросла в передачу экспертизы, что позволило компании взять под полный контроль жизненный цикл своего ландшафта машинного обучения (ML) и заложить фундамент для будущего масштабирования.

Следующим этапом станет расширение интеграции с Azure DevOps для автоматизации сопровождающих процессов. Это позволит связать систему управления жизненным циклом моделей (ЖЦМ) с корпоративным трекером задач: система будет автоматически создавать задачи, контролировать их исполнение и привязывать к ним артефакты разработки. Такой подход обеспечит сквозной контроль и прозрачность на всех этапах работы. Кроме того, планируется внедрить инструменты разметки данных, что позволит командам проводить полный цикл подготовки в рамках единого контура, не переключаясь между внешними сервисами.
Для страхового бизнеса скорость принятия решений и точность оценки рисков — определяющие факторы конкурентоспособности. Проект позволил перейти от разрозненных прикладных задач к применению промышленного инструмента на основе ИИ. Это означает более точную персонализацию, оптимизацию убыточности и возможность оперативно реагировать на изменения рынка, опираясь на глубокую аналитику данных, — сказал Сергей Багно, директор департамента искусственного интеллекта и развития отношений с клиентами компании «Ингосстрах».
Data Ocean Nova и Kolmogorov AI создают единую среду для работы с искусственным интеллектом. Мы автоматизировали весь цикл: от подготовки данных до вывода моделей из эксплуатации. Использование каталога признаков и средств координации алгоритмов превращает разработку в отлаженный конвейер. Наши продукты обеспечивают надежный фундамент для масштабирования аналитики и работы с языковыми моделями, — отметил Алексей Рундасов, коммерческий директор Data Sapience.
Проект в «Ингосстрахе» уникален своей комплексностью: мы не просто внедряли софт, а выстраивали методологию взаимодействия десятков команд внутри единого процесса операционализации моделей машинного обучения (MLOps). Важнейшим этапом стала глубокая проработка безопасности — мы создали доверенную среду, где проприетарные решения Data Sapience и компоненты с открытым исходным кодом (Open Source) работают как единое целое, полностью соответствуя требованиям ИБ. Платформа интегрирована более чем с 10 ключевыми ИТ-системами заказчика, включая хранилище данных (DWH) и инструментарий непрерывной разработки и эксплуатации (DevOps). Это позволило создать промышленный конвейер, рассчитанный на поддержку сотен моделей, что даёт компании принципиально иной масштаб работы с искусственным интеллектом, — сказал Александр Ефимов, директор практики искусственного интеллекта и машинного обучения GlowByte.