«Норникель» совместно с интегратором GlowByte внедрил корпоративную ML-платформу на базе ПО Kolmogorov российского вендора Data Sapience. Решение позволило создать единую среду работы с алгоритмами машинного обучения и реализовать унифицированную, масштабируемую и высокоэффективную инфраструктуру для отслеживания полного жизненного цикла AI/ML-приложений и глубокого анализа данных.
ML-платформа интегрирована с корпоративной Data-платформой «Озеро данных» и системой DevSecOps (корпоративный репозиторий) и состоит из различных инструментов, развернутых в кластерах Kubernetes, среди которых – среда для разработки JupyterLab, инструмент управления экспериментами MLFlow, оркестратор batch-процессов AirFlow, средства мониторинга Grafana. ПО Kolmogorov выступает единой точкой входа, которая связывает эти компоненты в цельную экосистему, повышает производительность всех членов команды Data Science, а также обеспечивает управление имеющимися вычислительными ресурсами и быстрое масштабирование.
Архитектура платформы спроектирована с учетом многопользовательского доступа для большого количества специалистов, включая внутренние DS-команды и внешних разработчиков ML.
Пользовательский интерфейс для управления и продуктивной работы со стеком технологий и open-source-инструментами также реализован с помощью ПО Kolmogorov. Инструмент позволяет запускать и использовать среды разработки моделей машинного обучения, отслеживать состояние выполнения CI/CD-пайплайнов внедрения, получать информацию о состоянии продуктивизированных моделей, использовать заготовленные шаблоны проектов разработки, предоставлять контролируемый доступ к реестру всех проектов создания моделей машинного обучения, которые содержат всю необходимую информацию, собранную в процессе разработки и внедрения моделей машинного обучения. Такое комплексное решение упрощает как работу над ML-проектами, так и координацию деятельности отдельных команд разработки.
Среда Kubernetes позволяет масштабировать приложения и модели согласно текущим потребностям без серьезных изменений в архитектуре, обеспечивая оптимальное использование ресурсов и снижение затрат. Автоматическое управление кластерами и контейнерами сокращает трудозатраты на поддержку и обслуживание системы, повышает надежность и устойчивость функционирования приложений. Модульный подход обеспечивает гибкость системы и возможность установки дополнительных компонентов.
Таким образом, благодаря передовым инструментам на базе ПО Kolmogorov DS-команды получили возможность значительно сократить показатели time-to-market и time-to-product, вследствие чего компания может быстрее реагировать на требования рынка и внедрять современные решения.