MLOps/DevOps

Дата размещения вакансии: 20.03.2026
Работодатель: Т1
Уровень зарплаты:
з/п не указана
Город:
Самара
Требуемый опыт работы:
От 3 до 6 лет

Мы строим экосистему цифровых помощников на базе open-source LLM/VLM. Наши AI-агенты не просто «болтают», а автоматизируют бизнес-процессы клиентов — от автоматизации процессов до интеллектуального анализа данных. Мы ищем в команду MLOps Engineer’а, который построит надёжную и масштабируемую платформу для развёртывания и мониторинга наших AI-агентов и мультиагентских систем.

Вместе с нами тебе предстоит:

  • DevOps для AI: Проектирование и развитие self-service CI/CD пайплайнов для бесшовного деплоя AI-агентов и мультиагентных систем.
  • Инференс под нагрузкой: Развертывание и оптимизация LLM/VLM в продакшене (оптимизация памяти, скорость генерации) с использованием vLLM, Triton Inference Server, SGLang.
  • Надёжность: Обеспечение высокой доступности сервисов, работа с масштабированием горизонтальных подов и управление состоянием агентов.
  • Мониторинг 360°: Внедрение комплексного observability: от стандартных метрик (CPU/GPU, latency) до специфичных ML-метрик (качество генерации, дрейф данных, оценка тональности ответов).

Требования:

  • Обязательный опыт вывода LLM-решений в прод.
  • Уверенное владение Python и асинхронным программированием (asyncio).
  • Уверенное владение Kubernetes (Helm, управление кластерами).
  • Знание Gitlab CI, Jenkins и пр
  • Понимание архитектуры RAG-систем, работы embedding-моделей и ранжирования.
  • Умение оптимизировать инференс: квантизация, continuous batching, PagedAttention.

Будет плюсом: опыт с графовыми БД и построением мультиагентных систем

Стек: Python, FastAPI, langchain/llamaindex/haystack k8s, docker, S3, postgres Опыт работы с векторными и графовыми БД.