ML Ops инженер / Dev Ops (ИИ-продукты)

Дата размещения вакансии: 26.06.2024
Работодатель: Гринатом
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Команда Центра экспертизы по Искусственному интеллекту занимается развитием сервисов и продуктов с применением ИИ в большой и разнообразной отрасли под названием Росатом. Сейчас команда постепенно выстраивает правильный пайплайн работы с данными, как в рамках нашей платформы, так и в рамках ИИ-продуктов, которые параллельно активно разрабатывает. Текущая позиция подразумевает уверенное ориентирование сразу в двух областях: ML Ops для разработки пайплайнов работы с ML-моделями и Dev Ops для поддержания и развития нашего CI/CD.

Обязанности:

  • Разрабатывать и поддерживать конвейеры CI/CD для моделей машинного обучения;
  • Автоматизировать процессы развертывания и мониторинга моделей ML в prod;
  • Оптимизировать производительность и безопасность моделей в микросервисной инфраструктуре;
  • Управлять версиями моделей и их конфигурацией;
  • Оптимизировать расходы на содержание AI-инфраструктуры;
  • Внедрять и поддерживать практики MLOps для обеспечения эффективной работы всей команды;
  • Разработка и улучшение CI/CD процессов сборки, тестирования, деплоя сервисов и приложений на сервера (Gitlab, Docker, k8s).
  • Поддержка и улучшение инфраструктурных систем (системы мониторинга, очередей, логирования).
  • Участие в разработке уже имеющихся приложений в составе команды Data Science;
  • Исследование и внедрение новых инструментов в сфере DevOps/SRE/MLOps.
  • Ведение технической документации и написание инструкций;
  • Написание и согласование необходимой документации по продукту, связанной с межсерверными взаимодействиями / коммуникации со смежными подразделениями и ИБ.

Требования:

  • Знание базовых ИТ-технологий (модель OSI, DNS, PKI, Сети, виртуализация, контейнеризация, протоколы аутентификации и т.д.);
  • Знание и опыт администрирования операционных систем GNU/Linux;
  • Понимание основных принципов информационной безопасности;
  • Опыт работы с AI/ML-решениями в проде;
  • Уверенное знание Python, а также backend-фреймворки: FastAPI, Django;
  • Умение работать с инструментами контейнеризации (Docker, Kubernetes);
  • Опыт разработки backend-приложений и внедрения CI/CD конвейеров;
  • Знание облачных платформ (VK Cloud, Azure) и опыт работы с ними;
  • Опыт работы с инструментами мониторинга и логирования (Prometheus, Grafana, ELK stack и т.д.);
  • Опыт работы с MLOps инструментами: ClearML, MLFlow, OpenVINO;
  • Опыт работы с SQL/NoSQL и S3-хранилищами: PostgreSQL, MongoDB, MinIO;

Будет плюсом:

  • Опыт работы с LangChain / LLM-сервисами;
  • Опыт работы с Airflow и умение выстраивать DWH-пайплайны;
Что мы предлагаем:

Комфортные условия работы

  • современные рабочие места;
  • цифровые сервисы для сотрудников.

Обучение и развитие

  • собственная онлайн-платформа с программами профессионального и личностного роста — от инженерных курсов до изучения иностранных языков;
  • участие в конференциях, тренингах и конкурсах профессионального мастерства.

Карьерные возможности

  • карьерные консультации для построения экспертной или управленческой траектории роста;
  • поддержка карьерного развития сотрудников.

Социальные программы

  • ДМС со стоматологией и госпитализацией;
  • страхование несчастных случаев на производстве;
  • линия психологической поддержки;
  • финансовая помощь в особых жизненных ситуациях.

Корпоративная жизнь

  • тимбилдинги;
  • спортивные активности и отраслевые соревнования;
  • волонтерские движения;
  • мероприятия для сотрудников и их семей.