Инженер LLM / SRE (LLM-платформа)

Дата размещения вакансии: 01.07.2026

Работодатель: МАТРИ

Уровень зарплаты:

з/п не указана

Город:

Москва
Западный административный округ, Можайский район, Инновационный центр Сколково, Большой бульвар 42с1

Требуемый опыт работы:

От 3 до 6 лет

О проекте
Локальная мультиагентная платформа для анализа бизнес‑процессов на основе LLM. Платформа развёртывается в инфраструктуре заказчика (on‑premise), интегрируется с корпоративными системами и масштабируется на новые бизнес‑случаи.

Наша задача — создать надёжную, управляемую и защищённую AI‑платформу, готовую к промышленной эксплуатации.

Кого мы ищем
Опытного инженера LLM / SRE, который сможет сочетать навыки backend‑разработки, работы с LLM и эксплуатации.

Вы будете отвечать за разработку мультиагентных сценариев, развёртывание локальных моделей, интеграции и обеспечение стабильной работы платформы.

Ключевые обязанности

Разработка, развёртывание и сопровождение мультиагентной архитектуры (агенты, маршрутизация, RAG‑конвейеры).
Проектирование и оптимизация промптов, систем контроля качества генерации и agent‑flows.
Развёртывание локальных LLM, управление версиями моделей и оптимизация inference.
Интеграция с корпоративными системами через REST/API, обеспечение безопасности передач данных.
Настройка CI/CD процессов для микросервисов (Docker, GitLab CI/GitHub Actions), автоматизация развёртываний и откатов.
Настройка мониторинга, логирования и алертинга (Prometheus, Grafana, Loki/ELK), сбор метрик качества генерации.
Участие в инцидент‑менеджменте, root cause analysis и повышении надёжности (SRE‑взаимодействия).
Подготовка документации, обучение внутренних команд и поддержка code review.

Требования (обязательные)

Python 3.10+ — уверенная разработка сервисов, знание async/await, практический опыт написания тестов.
Практический опыт работы с LLM / Generative AI: PoC или production‑проекты, ежедневное использование моделей в инженерной деятельности.
Опыт построения RAG‑pipeline и работы с фреймворками вроде LangChain / LlamaIndex / LangGraph.
Опыт развёртывания серверных приложений в Linux‑окружении.
Уверенное владение Docker и Docker Compose; базовые навыки оркестрации (Kubernetes).
Опыт интеграции через REST API, умение работать с корпоративными системами.
Готовность к работе on‑premise / гибридно; технический английский для чтения документации.

Желательные навыки (будут преимуществом)

Опыт эксплуатации AI‑инфраструктуры: управление моделями, настройка inference на CPU/GPU, оптимизация latency.
Опыт работы с векторными базами (Qdrant, Milvus, pgvector).
Навыки SRE/DevOps: Prometheus, Grafana, Loki/ELK, GitLab CI/GitHub Actions на production‑уровне.
Опыт работы с Yandex Cloud / Yandex AI Studio.
Опыт PostgreSQL, Redis, SQL.
Опыт в MLOps и управлении ML‑pipelines.

Опыт

Коммерческий опыт разработки: от 2 лет (или эквивалентные проекты/портфолио).
Практический опыт с LLM/GenAI: от 1 года (PoC или production).
Docker/Linux/развёртывание серверных приложений: от 1 года.

Примеры реальных задач

Свернуть RAG‑pipeline по корпоративной документации, снизив latency и сохранив точность поиска.
Настроить CI/CD процесс для обновления локальной модели с автоматическим откатом при регрессе.
Построить метрики качества генерации и интегрировать мониторинг с алертами при деградации.

Soft skills и культура

Умение формализовать требования и коммуницировать с заказчиком.
Самостоятельность, ответственность за участок платформы, умение приоритизировать задачи.
Готовность к командной работе в кросс‑функциональной команде инженеров и ML‑research.

Условия работы

Формат: on‑premise / гибрид (точный режим обсуждается на собеседовании).
Проектная занятость (+/-6 месяцев).
Команда: компактная команда инженеров и ML‑research.
Конкурентная оплата.

Как откликнуться
В сопроводительном письме, пожалуйста, опишите кратко один проект с LLM: цель, стек, ваша роль, результат (включая метрики, если есть).

Откликнуться

Инженер LLM / SRE (LLM-платформа)

Похожие вакансии: Москва