Москва
AI Lab — это команда профессионалов, разрабатывающая масштабные AI-решения для всей экосистемы крупнейшего ритейлера России.
Сейчас мы в поиске коллеги DevOps/MLOps инженера, который усилит нашу команду. Нам важен опыт не только в Ops-части, но и понимание процессов разработки ML-моделей и их интеграции в продакшн.
Стек: Docker, Kubernetes, Terraform, Helm, Yandex Cloud, GitLab, ArgoCD, Grafana, Prometheus, Loki, Litellm, Sentry, Triton, vLLM, PostgreSQL, Redis, Qdrant, ClearML, Python, FastAPI.
чем ты будешь заниматься
- разворачивать и поддерживать ML-инфраструктуру в Kubernetes: ML-модели, сервисы, базы данных;
- настраивать и оптимизировать инференс-сервисы и системы мониторинга;
- работать с облачными сервисами и управлять инфраструктурой через Terraform;
- автоматизировать деплоймент ML-сервисов и взаимодействовать с ML командой;
- поддерживать ClearML для управления экспериментами и автоматизации обучения и деплоя;
- оптимизировать CI/CD и развертывание моделей, улучшать инструменты для экспериментов и мониторинга.
мы ожидаем
- опыт 3+ лет в DevOps/MLOps или ML-разработке;
- владение Kubernetes и облачными технологиями;
- навыки работы с Helm, ArgoCD и написание Terraform-модулей;
- практика работы с мониторингом, логированием и ML-инференс серверами.