ML Ops Engineer (KubeFlow, Airflow)

Дата размещения вакансии: 01.10.2025
Работодатель: USETECH
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 1 года до 3 лет

Юзтех – группа аккредитованных ИТ-компаний полного цикла разработки с многолетней экспертизой в передовых технологиях: DWH, BigData, AI/ML, Blockchain, BI, предиктивная аналитика, цифровые двойники производства и рисков.

ГК Юзтех является технологическим партнером таких компаний, как Mail.ru, 2Gis, НЛМК, Еврохим, Go Invest, Альфа-Банк, Сбер, ВТБ, МКБ, Самолет Девелопмент, Х5 Group, Газпромнефть, Лемана Про, Ситилинк, Ланит, IBS. Также, ГК разрабатывает собственные IT-продукты (Usebus, Octopus, Тил Эйчар) и флагманские проекты, которыми пользуется 70% населения страны.

Сейчас мы находимся в поиске ML Ops инженера

Работа в продуктовой команде корпоративной дата-платформы (Data Platform)

Cтек: (Kubeflow, Kubernetes, Kafka, Kserve, Langfuse)

Обязанности:

  • Настройка и поддержка мониторинга моделей (latency, drift, cost metrics)
  • Управление пайплайнами данных для обучения и inference (Kafka, DataLake, объектное хранилище S3, векторные БД)
  • Оптимизация работы GPU-кластера (распределённое обучение, эффективное использование ресурсов)
  • Внедрение и поддержка CI/CD-процессов
  • Обеспечение безопасности и комплаенса: изоляция сред, контроль доступа, логирование
  • Совместная работа с ML инженерами и SRE командой для обеспечения стабильной работы сервисов
  • Документирование решений и передача знаний команде.

Пожелания к опыту:

  • Опыт работы с Kubernetes и облачными/он-prem кластерами
  • Знание Python и инструментов ML Ops (Kubeflow, Airflow)
  • Опыт настройки CI/CD (Jenkins/gitflow)
  • Знания в области мониторинга и логирования (Prometheus, Grafana, ELK, OpenTelemetry)

Будет плюсом:

Понимание принципов работы LLM/GenAI и RAG-систем

Опыт работы с системами хранения и векторными БД (Weaviate/Qdrant/PGVector)