Мы — команда, создающая ядро интеллектуальных сервисов для международной аналитической платформы. Наш продукт помогает бизнесу принимать стратегические решения на глобальных рынках, используя любые типы данных — от новостных лент до внутренних баз знаний.
Мы ищем сильного и самостоятельного специалиста, который хочет заниматься автономными ИИ‑агентами, а не просто обёртками над LLM. Вы будете влиять на архитектуру, выбирать технологии и отвечать за полный жизненный цикл ML‑продукта в on‑premise‑среде.
Обязанности
- Разрабатывать production‑ready ИИ‑агентов
Проектировать multi‑agent системы для бизнес‑задач: оценка рисков, анализ контрагентов, поиск альтернативных рынков, санкционный комплаенс.
Реализовывать планирование (planning), использование инструментов (tool use), управление памятью (memory) и рефлексию агентов.
Внедрять систему оценки агентов: метрики точности, надёжности и эффективности выполнения цепочек действий.
- Создавать и оптимизировать RAG‑пайплайны
Многоканальная индексация (веб‑страницы, PDF, базы данных, устная речь)
Эксперименты с chunking, embedding‑моделями, retrieval‑стратегиями (гибридный поиск, re‑ranking, query rewriting)
- Строить высоконагруженные ML‑сервисы
Асинхронное выполнение, кеширование, rate limiting, fallback‑механизмы.
- Весь цикл ML‑продукта
От исследования и прототипирования до CI/CD, мониторинга дрейфа моделей и A/B‑тестов агентных сценариев
- Интегрировать LLM в микросервисную архитектуру
Как open‑source (Llama, Mistral, Qwen), так и коммерческие модели
Упаковка моделей в Triton, vLLM или llama.cpp для on‑premise
- Обеспечивать производительность и надёжность
Оптимизация latency / throughput, работа с ограничениями GPU, баланс между качеством и скоростью
- Работать в связке с бэкендом и продуктом
Бесшовная интеграция агентных сценариев в основную платформу.
Требования
- проектировать multi‑agent системы с planning, tool use, memory и рефлексией для бизнес‑задач (риски, контрагенты, комплаенс)
- строить и оптимизировать RAG‑пайплайны: многоканальная индексация, гибридный поиск, реранжинг
- разрабатывать высоконагруженные ML‑сервисы (асинхронность, кеширование, rate limiting, fallback)
- интегрировать LLM (open‑source и внутренние модели, включая GigaChat) в микросервисную архитектуру с упаковкой через Triton/vLLM/llama.cpp
- обеспечивать производительность, надёжность и безопасность в закрытом контуре
- внедрять CI/CD, мониторинг дрейфа, A/B‑тесты агентных сценариев.
Условия
- офисный или гибридный формат в Москве
- ежегодный пересмотр зарплаты и годовая премия
- расширенный ДМС и льготное страхование для семьи
- уникальная система обучения Сбера для профессионального и карьерного развития
- выгодная ипотека для сотрудников
- бесплатная подписка СберПрайм+, скидки на продукты компании-партнёров
- вознаграждение за рекомендацию друзей в команду Сбера
- корпоративная пенсионная программа.