Западный административный округ, Можайский район, Инновационный центр Сколково, Большой бульвар 42с1
О проекте
Локальная мультиагентная платформа для анализа бизнес‑процессов на основе LLM. Платформа развёртывается в инфраструктуре заказчика (on‑premise), интегрируется с корпоративными системами и масштабируется на новые бизнес‑случаи.
Наша задача — создать надёжную, управляемую и защищённую AI‑платформу, готовую к промышленной эксплуатации.
Кого мы ищем
Опытного инженера LLM / SRE, который сможет сочетать навыки backend‑разработки, работы с LLM и эксплуатации.
Вы будете отвечать за разработку мультиагентных сценариев, развёртывание локальных моделей, интеграции и обеспечение стабильной работы платформы.
Ключевые обязанности
- Разработка, развёртывание и сопровождение мультиагентной архитектуры (агенты, маршрутизация, RAG‑конвейеры).
- Проектирование и оптимизация промптов, систем контроля качества генерации и agent‑flows.
- Развёртывание локальных LLM, управление версиями моделей и оптимизация inference.
- Интеграция с корпоративными системами через REST/API, обеспечение безопасности передач данных.
- Настройка CI/CD процессов для микросервисов (Docker, GitLab CI/GitHub Actions), автоматизация развёртываний и откатов.
- Настройка мониторинга, логирования и алертинга (Prometheus, Grafana, Loki/ELK), сбор метрик качества генерации.
- Участие в инцидент‑менеджменте, root cause analysis и повышении надёжности (SRE‑взаимодействия).
- Подготовка документации, обучение внутренних команд и поддержка code review.
Требования (обязательные)
- Python 3.10+ — уверенная разработка сервисов, знание async/await, практический опыт написания тестов.
- Практический опыт работы с LLM / Generative AI: PoC или production‑проекты, ежедневное использование моделей в инженерной деятельности.
- Опыт построения RAG‑pipeline и работы с фреймворками вроде LangChain / LlamaIndex / LangGraph.
- Опыт развёртывания серверных приложений в Linux‑окружении.
- Уверенное владение Docker и Docker Compose; базовые навыки оркестрации (Kubernetes).
- Опыт интеграции через REST API, умение работать с корпоративными системами.
- Готовность к работе on‑premise / гибридно; технический английский для чтения документации.
Желательные навыки (будут преимуществом)
- Опыт эксплуатации AI‑инфраструктуры: управление моделями, настройка inference на CPU/GPU, оптимизация latency.
- Опыт работы с векторными базами (Qdrant, Milvus, pgvector).
- Навыки SRE/DevOps: Prometheus, Grafana, Loki/ELK, GitLab CI/GitHub Actions на production‑уровне.
- Опыт работы с Yandex Cloud / Yandex AI Studio.
- Опыт PostgreSQL, Redis, SQL.
- Опыт в MLOps и управлении ML‑pipelines.
Опыт
- Коммерческий опыт разработки: от 2 лет (или эквивалентные проекты/портфолио).
- Практический опыт с LLM/GenAI: от 1 года (PoC или production).
- Docker/Linux/развёртывание серверных приложений: от 1 года.
Примеры реальных задач
- Свернуть RAG‑pipeline по корпоративной документации, снизив latency и сохранив точность поиска.
- Настроить CI/CD процесс для обновления локальной модели с автоматическим откатом при регрессе.
- Построить метрики качества генерации и интегрировать мониторинг с алертами при деградации.
Soft skills и культура
- Умение формализовать требования и коммуницировать с заказчиком.
- Самостоятельность, ответственность за участок платформы, умение приоритизировать задачи.
- Готовность к командной работе в кросс‑функциональной команде инженеров и ML‑research.
Условия работы
- Формат: on‑premise / гибрид (точный режим обсуждается на собеседовании).
- Проектная занятость (+/-6 месяцев).
- Команда: компактная команда инженеров и ML‑research.
- Конкурентная оплата.
Как откликнуться
В сопроводительном письме, пожалуйста, опишите кратко один проект с LLM: цель, стек, ваша роль, результат (включая метрики, если есть).