Москва
Ищу DevOps с уклоном в ML Ops в крупный B2B маркетплейс, который активно использует современные AI-решения для своего функционирования (улучшение поиска, категоризацию товаров, рекомендации для пользователей): классику ML, нейронные сети, большие языковые модели.
Задачи:
- Создание и поддержание инфраструктуры для обучения и обновления моделей;
- Внедрение и развитие компонентов ML-платформы в парадигме Model as a Service;
- Развитие Observability сервисов ML-платформы;
- Cопровождение сервисов на Python;
- Интеграция CI/CD процессов для обновлений: Разработка и внедрение процессов CI/CD для автоматизированного обновления моделей, настройки логирования и тестирования;
- Управление и координация версий моделей: Ведение версий моделей и контроль изменения версий;
- Поддержка и мониторинг ML - инфраструктуры;
- Интеграция инструментов мониторинга для анализа данных и состояния моделей: Настройка Prometheus, Grafana и других инструментов для постоянного анализа данных и состояния моделей.
Нам важно:
- Основной стек: Jupyterhub, Airflow, ArgoWF, MLflow, ClearML, Seldon core, Python, Hadoop (spark, hdfs), Docker,Kubernetes, longhorn, Jenkins, Kafka, Redis, PostgreSQL, OpenSearch, GitLab;
- Понимание работы CUDA и умение разрешать конфликты между CUDA, драйверами и библиотеками (особенно в ONNX runtime);
- Опыт развертывания и поддержки больших языковых моделей через VLLM, в том числе балансировки запросов;
- DevOps: понимание docker, k8s и gitlab ci-cd;
- MLOps: oбщее понимание терминологии, концепций и составляющих архитектуры ML-инфраструктуры; oпыт разворачивания MLFlow.
Со своей стороны предлагаем:
- Оформление по ТК РФ в аккредитованную компанию;
- Удаленный формат работы или гибрид;
- ДМС со стоматологией и оплата больничных;
- Обучение и корпоративные скидки от партнеров.