LLM Platform Engineer (ML Engineer)

Дата размещения вакансии: 17.03.2026
Работодатель: СБЕР
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Наша задача - создать систему (ASC AI Fabrique), которая создает ИИ-агентов для оптимизации различных бизнес-процессов клиентских менеджеров. Система представляет собой рой специализированных ИИ-агентов, задача которых - выполнять полный SDLC (жизненный цикл разработки программного обеспечения) для создания других ИИ-агентов.

ASC AI Fabrique — это мета-генеративная фабрика цифровых сотрудников (ИИ-агентов), построенная на парадигме Agentic Swarm Coding. Система способна автономно проектировать, кодировать, тестировать и разворачивать ИИ-агентов по текстовому бизнес-описанию.

Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры.

ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!

Обязанности

  • развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism
  • организация MLOps-процессов и системная оценка качества моделей
  • обеспечение production latency <2s и uptime >95% для инфраструктуры inference
  • профилирование и оптимизация использования VRAM (CUDA OOM prevention)
  • мониторинг GPU-производительности.

Требования

  • Python (asyncio, multiprocessing, typing) Advanced уровня
  • Bash/Shell scripting Advanced уровня для автоматизации развертывания
  • практический опыт с vLLM, TensorRT-LLM, TGI для serving моделей
  • опыт работы с квантизацией (AWQ, GPTQ, GGUF) для снижения требований к VRAM
  • знание оптимизаций Flash Attention и Paged Attention
  • навыки работы с PyTorch, JAX, ONNX для универсального развертывания
  • опыт отладки GPU memory и понимание CUDA (Intermediate C++/CUDA).

Условия

  • комфортный современный офис рядом с м. Кутузовская
  • гибридный формат работы
  • ежегодный пересмотр зарплаты и годовая премия
  • корпоративный спортзал и зоны отдыха
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • программа адаптации и помощь руководителя на старте
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.