Кутузовский проспект 32
Мы ищем ML Engineer в RnD подразделение для работы над специализированной моделью для агентного поиска. Наша цель — переход от статических RAG-пайплайнов к адаптивным агентным системам, управляющим процессом извлечения знаний. Вам предстоит работать на стыке инженерии и исследований: создавать датасеты, обучать модели (SFT/RL) и сравнивать эффективность кастомных решений с существующими фреймворками.
Обязанности
- Разработка тестовых корзин для оценки многошагового поиска (multi-step retrieval) и сложных запросов;
- Дообучение языковых моделей (SFT, LoRA) и применение методов Reinforcement Learning (GRPO) для оптимизации стратегий поиска;
- Сравнительный анализ производительности: кастомные модели управления поиском vs агентные подходы на базе фреймворков (ReAct);
- Проектирование и поддержка пайплайнов оценки качества поиска для агентных систем.
Требования
- Опыт от 1 года коммерческой разработки в NLP с фокусом на LLM и RAG-архитектуры;
- Понимание работы и стратегий поиска (векторные модели, реранкеры, ReAct);
- Умение оценивать качество поиска (Recall, MRR, NDCG) и проектировать эксперименты для сравнения гипотез;
- Владение экосистемой: PyTorch, HuggingFace, vLLM, LangChain/LangGraph;
Будет плюсом:
- Опыт дообучения эмбеддеров или LLM;
- Опыт реализации многошаговых агентных сценариев;
- Публикации, соревнования или пет-проекты, связанные с задачей поиска.
Условия
- Кластер с GPU A100 для экспериментов;
- комфортный современный офис рядом с м. Кутузовская
- гибридный формат работы
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- система обучения для профессионального и карьерного развития
- расширенный полис ДМС с первого дня работы и страхование для семьи
- программа ипотеки для сотрудников
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.