Москва
Команда Центра экспертизы по Искусственному интеллекту занимается развитием сервисов и продуктов с применением ИИ в большой и разнообразной отрасли под названием Росатом. Сейчас команда постепенно выстраивает правильный пайплайн работы с данными, как в рамках нашей платформы, так и в рамках ИИ-продуктов, которые параллельно активно разрабатывает.
Обязанности:
- Разрабатывать и поддерживать конвейеры CI/CD для моделей машинного обучения;
- Автоматизировать процессы развертывания и мониторинга моделей ML в prod;
- Оптимизировать производительность и безопасность моделей в микросервисной инфраструктуре;
- Управлять версиями моделей и их конфигурацией;
- Оптимизировать расходы на содержание AI-инфраструктуры;
- Внедрять и поддерживать практики MLOps для обеспечения эффективной работы всей команды;
- Разработка и улучшение CI/CD процессов сборки, тестирования, деплоя сервисов и приложений на сервера (Gitlab, Docker, k8s).
- Поддержка и улучшение инфраструктурных систем (системы мониторинга, очередей, логирования).
- Участие в разработке уже имеющихся приложений в составе команды Data Science;
- Исследование и внедрение новых инструментов в сфере DevOps/SRE/MLOps.
- Ведение технической документации и написание инструкций;
- Написание и согласование необходимой документации по продукту, связанной с межсерверными взаимодействиями / коммуникации со смежными подразделениями и ИБ.
Требования:
- Знание базовых ИТ-технологий (модель OSI, DNS, PKI, Сети, виртуализация, контейнеризация, протоколы аутентификации и т.д.);
- Знание и опыт администрирования операционных систем GNU/Linux;
- Понимание основных принципов информационной безопасности;
- Умение работать с инструментами контейнеризации (Docker, Kubernetes);
- Опыт разработки backend-приложений и внедрения CI/CD конвейеров;
- Знание облачных платформ (VK Cloud, Azure) и опыт работы с ними;
- Опыт работы с инструментами мониторинга и логирования (Prometheus, Grafana, ELK stack и т.д.);
- Опыт работы с MLOps инструментами: ClearML, MLFlow, OpenVINO;
- Опыт работы с SQL/NoSQL и S3-хранилищами: PostgreSQL, MongoDB, MinIO.
Будет плюсом:
- Опыт работы с LangChain / LLM-сервисами;
- Опыт работы с Airflow и умение выстраивать DWH-пайплайны;
- Знание Python, а также backend-фреймворки: FastAPI, Django;
- Опыт работы с AI/ML-решениями в проде.
Условия:
- Работа в ИТ аккредитованной Компании с возможностью профессионального развития и карьерного роста;
- Удаленная занятость (только на территории РФ);
- Стабильная "белая" заработная плата 2 раза в месяц, годовой бонус;
- Пятидневная рабочая неделя с 9.00 до 18.00, в пятницу до 16.45;
- Оформление по ТК РФ с первого рабочего дня;
- Обучение за счет компании;
- ДМС (включая стоматологические услуги) с первого дня работы.