Москва
Команда Центра экспертизы по Искусственному интеллекту занимается развитием сервисов и продуктов с применением ИИ в большой и разнообразной отрасли под названием Росатом. Сейчас команда постепенно выстраивает правильный пайплайн работы с данными, как в рамках нашей платформы, так и в рамках ИИ-продуктов, которые параллельно активно разрабатывает. Текущая позиция подразумевает уверенное ориентирование сразу в двух областях: ML Ops для разработки пайплайнов работы с ML-моделями и Dev Ops для поддержания и развития нашего CI/CD.
Обязанности:
- Разрабатывать и поддерживать конвейеры CI/CD для моделей машинного обучения;
- Автоматизировать процессы развертывания и мониторинга моделей ML в prod;
- Оптимизировать производительность и безопасность моделей в микросервисной инфраструктуре;
- Управлять версиями моделей и их конфигурацией;
- Оптимизировать расходы на содержание AI-инфраструктуры;
- Внедрять и поддерживать практики MLOps для обеспечения эффективной работы всей команды;
- Разработка и улучшение CI/CD процессов сборки, тестирования, деплоя сервисов и приложений на сервера (Gitlab, Docker, k8s).
- Поддержка и улучшение инфраструктурных систем (системы мониторинга, очередей, логирования).
- Участие в разработке уже имеющихся приложений в составе команды Data Science;
- Исследование и внедрение новых инструментов в сфере DevOps/SRE/MLOps.
- Ведение технической документации и написание инструкций;
- Написание и согласование необходимой документации по продукту, связанной с межсерверными взаимодействиями / коммуникации со смежными подразделениями и ИБ.
Требования:
- Знание базовых ИТ-технологий (модель OSI, DNS, PKI, Сети, виртуализация, контейнеризация, протоколы аутентификации и т.д.);
- Знание и опыт администрирования операционных систем GNU/Linux;
- Понимание основных принципов информационной безопасности;
- Опыт работы с AI/ML-решениями в проде;
- Уверенное знание Python, а также backend-фреймворки: FastAPI, Django;
- Умение работать с инструментами контейнеризации (Docker, Kubernetes);
- Опыт разработки backend-приложений и внедрения CI/CD конвейеров;
- Знание облачных платформ (VK Cloud, Azure) и опыт работы с ними;
- Опыт работы с инструментами мониторинга и логирования (Prometheus, Grafana, ELK stack и т.д.);
- Опыт работы с MLOps инструментами: ClearML, MLFlow, OpenVINO;
- Опыт работы с SQL/NoSQL и S3-хранилищами: PostgreSQL, MongoDB, MinIO;
Будет плюсом:
- Опыт работы с LangChain / LLM-сервисами;
- Опыт работы с Airflow и умение выстраивать DWH-пайплайны;
Комфортные условия работы
- современные рабочие места;
- цифровые сервисы для сотрудников.
Обучение и развитие
- собственная онлайн-платформа с программами профессионального и личностного роста — от инженерных курсов до изучения иностранных языков;
- участие в конференциях, тренингах и конкурсах профессионального мастерства.
Карьерные возможности
- карьерные консультации для построения экспертной или управленческой траектории роста;
- поддержка карьерного развития сотрудников.
Социальные программы
- ДМС со стоматологией и госпитализацией;
- страхование несчастных случаев на производстве;
- линия психологической поддержки;
- финансовая помощь в особых жизненных ситуациях.
Корпоративная жизнь
- тимбилдинги;
- спортивные активности и отраслевые соревнования;
- волонтерские движения;
- мероприятия для сотрудников и их семей.