з/п не указана
Москва
Овчинниковская набережная 18/1с2
Овчинниковская набережная 18/1с2
От 1 года до 3 лет
Чем предстоит заниматься
- Проектированием и развитием LLM-агентов для продавцов маркетплейса: автоматизация операций поставки, вывоза, перемещения товаров между складами и других логистических действий;
- Разработкой и развитием RAG-систем для работы с внутренними регламентами, заявками, документацией и данными о товарах;
- Интеграцией и оркестрацией LLM (в том числе через LangGraph/LangChain) в существующие сервисы платформы;
- Проработкой процессов оценки, тестирования и мониторинга полноценных агентских систем (offline-метрики, auto-eval, трейсинг диалогов);
- Совместной работой с продуктовой командой: сбор требований, декомпозиция задач, участие в формировании и движении по продуктовому бэклогу по агентизации процессов;
- Поддержкой и развитием ML-сервисов в продакшене: оптимизация инференса, наблюдаемость, стабильность и качество ответов агентов.
От успешного соискателя мы ожидаем
- От 2 лет коммерческого опыта разработки (Python или Go);
- От 2 лет опыта в задачах NLP/GenAI/LLM;
- Понимание основных подходов к проектированию и архитектуре LLM-агентов (роль/инструменты, планирование, оркестрация, управление состоянием);
- Знание теоретических основ NLP — от bag-of-words/TF-IDF до современных Transformer/LLM-подходов;
-
Понимание и практический опыт применения RAG/CAG/KAG-подходов для решения бизнес-задач;
- Опыт оценки LLM-моделей и агентных систем (классические метрики, human-eval, auto-eval, работа с логами/трейсингом);
- Опыт файнтюнинга моделей (LoRA, QLoRA, DPO или аналогичные методы);
- Уверенное владение Python (ООП, PyTorch, экосистема для работы с данными и ML);
- Минимум один реализованный проект с LLM-агентами (production- или pet-проект) с возможностью показать код/демо;
- Понимание процесса продуктовой разработки и умение работать в условиях меняющихся требований.
Будет плюсом
- Опыт разработки сложных агентных систем (multi-agent, tool-calling, интеграция с внешними API и бэкенд-сервисами);
- Опыт построения систем наблюдаемости и качества для LLM-агентов (LangFuse или аналоги, кастомные дашборды, алерты);
- Опыт оптимизации LLM-инференса под высокие нагрузки (vLLM, Triton, ONNX/TorchScript, квантование);
- Опыт проведения A/B-тестов и продуктовых экспериментов для ML/LLM-функциональности;
- Опыт быстрого прототипирования интерфейсов и демо (Gradio/Streamlit или аналогичные инструменты);
- Опыт работы с асинхронными пайплайнами, очередями, оркестраторами (Celery, Kafka, Airflow и т.п.).
Наш стек
Разработка и инфраструктура: Python, Go (по желанию), Docker, Kubernetes, GitLab;
ML и LLM: PyTorch, Transformers, vLLM, Triton, LangGraph,, LangFuse;
Наблюдаемость: Prometheus, Grafana.
ML и LLM: PyTorch, Transformers, vLLM, Triton, LangGraph,, LangFuse;
Наблюдаемость: Prometheus, Grafana.