Мы развиваем инфраструктуру инференса больших языковых моделей: раскатка моделей, стабильность сервисов, производительность, cost optimization, взаимодействие с продуктовыми командами и эксплуатацией. Сейчас нам нужен человек, который поможет превратить быстрорастущую инженерную среду из «тушения пожаров» в понятную и управляемую систему процессов.
Обязанности
Внешние коммуникации и координация:
- Переводить технические статусы и инженерные ограничения в понятный бизнесу язык
- Управлять ожиданиями по срокам, релизам и инцидентам
- Синхронизировать команды inference, data engineering, DevOps, продуктовые и платформенные команды
- Координировать зависимости между задачами и командами
- Вести release-коммуникации: планы раскатки, changelog, оповещения стейкхолдеров
- Помогать с первичной обработкой инцидентов и входящих запросов
- Показывать эффект релизов через метрики:
○ снижение cost на inference
○ улучшение latency
○ стабильность сервисов
○ качество и reliability inference-платформы
Внутренние процессы команды:
- Поддерживать и структурировать backlog команды
- Помогать с декомпозицией и приоритизацией задач
- Контролировать прохождение релизных этапов и тестирования
- Следить за процессной гигиеной:
○ зависшие задачи
○ потерянные коммуникации
○ выпадающие из процессов участники
- Проводить первичную валидацию результата на соответствие бизнес-требованиям
- Помогать команде превращать ручные и хаотичные процессы в системные и автоматизированные
Требования
- Опыт работы project/program/release/operations manager в технических командах
- Умение работать с инженерными командами и не бояться технического контекста
- Способность быстро разбираться в сложных процессах и наводить порядок
- Умение доводить процессы до рабочего состояния, а не только «созваниваться и трекать»
- Хорошие коммуникационные навыки: умение говорить и с инженерами, и с бизнесом
- Опыт работы с Jira/Confluence
Будет плюсом
- Опыт работы с ML/LLM/AI-инфраструктурой
- Понимание inference, GPU-инфраструктуры или highload-сервисов
- Опыт работы с AI-инструментами разработки (Cursor, Claude Code и др.)
- Опыт автоматизации процессов (скрипты, боты, AI-инструменты, RAG и т.д.)
- Опыт построения support/release процессов
- Опыт работы в быстрорастущих инженерных организациях
Условия
- комфортный современный офис рядом с м. Кутузовская
- гибридный формат работы (2 дня в офисе, 3 дня на удалёнке)
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- система обучения для профессионального и карьерного развития
- расширенный полис ДМС с первого дня работы и страхование для семьи
- льготная программа ипотеки для сотрудников
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.