Senior Python Backend Developer, AI Agents Platform (MWS AI)

Дата размещения вакансии: 22.06.2026
Работодатель: МТС
Уровень зарплаты:
з/п не указана
Город:
Москва
Подсосенский переулок 23с5
Требуемый опыт работы:
Более 6 лет

MTS AI – это отдельная компания внутри экосистемы МТС. У нас царит атмосфера стартапа, новые продукты, никакого легаси, небольшие команды, с дружественной атмосферой.

Мы разрабатываем AI-решения и продукты, используя технологии обработки и синтеза естественного языка, компьютерного зрения и edge computing. Формируем AI-сообщество, сотрудничаем с ведущими технологическими компаниями и международными экспертами, проводим исследования, инвестируем в перспективные проекты и команды.

О продукте

Мы строим отказоустойчивую масштабируемую облачную платформу для создания и эксплуатации диалоговых AI-ассистентов: no-code конструктор агентов, оркестрация диалога, RAG, AutoML/MLOps и многоканальная доставка сообщений. Самих ботов и агентов под конкретного заказчика мы не пишем: мы делаем движок и инфраструктуру, на которых их собирают и гоняют в проде.

Сейчас к нам в команду мы ищем эксперта разработки, который возьмёт на себя самые критичные и нагруженные части платформы. Нам важен не только сильный инженер, но и человек, кому интересно, как индустрия агентов взрослеет на глазах: от prompt- к context engineering, от одиночного бота к мульти-агентным системам, MCP и A2A как новые стандарты, память и eval агентов, reasoning-модели, эффективный serving (vLLM/SGLang). Вы это не просто читаете в ленте,а пробуете руками.

Над чем будете работать

  • оркестратор диалога на LangGraph (граф сценариев, чекпоинтинг состояния, tool-calling, интеграция с LLM). Это сердце платформы и одна из самых нагруженных её частей

  • планирование и выполнение многошаговых задач, субагенты и мульти-агентная оркестрация

  • развитие долговременной памяти агентов, изолированные сэндбоксы для исполнения кода и инструментов, guardrails и контроль действий

  • парсинг и чанкинг документов, индексация и гибридный/семантический поиск в Milvus

  • рантайм диалога на Kafka: обработка входящих сообщений, маршрутизация ответов в каналы, поток событий диалога в аналитику

  • оценка качества агентов, наблюдаемость

Чем предстоит заниматься

  • реализовывать высоконагруженные бэкенды критичной бизнес-логики

  • быть владельцем кода одного или нескольких сервисов и отвечать за его качество, производительность, отказоустойчивость и документированность.

  • прототипировать и исследовать подходы (новые модели, фреймворки агентов, способы инференса), чтобы обоснованно выбирать решения, а не следовать хайпу

  • по желанию и в перспективе расти в техлида или тимлида продукта

Мы ожидаем от вас

  • релевантный опыт backend-разработки от 5 лет с Python как основным языком на экспертном уровне (у нас 3.12): понимаете не только как писать, но и как и почему оно работает под капотом

  • глубокое понимание async-модели: где asyncio даёт выигрыш, а где только добавляет сложности, как не положить event loop блокирующим вызовом и как дебажить асинхронный код под нагрузкой; опыт с async-фреймворком (у нас FastAPI)

  • опыт проектирования и эксплуатации высоконагруженных и отказоустойчивых сервисов (нагрузка, конкурентность, backpressure, деградация, идемпотентность)

  • уверенная работа с микросервисами и брокерами сообщений (у нас Kafka)

  • опыт с реляционными БД (у нас PostgreSQL); понимание, чем платить за консистентность и как не положить базу под нагрузкой

  • алгоритмы и структуры данных, ООП, SOLID, чистый читаемый код, code review, юнит-тесты

  • devOps-культура: CI/CD,gitlab, docker, kubernetes, консоль

  • интерес к домену агентов и актуальным ии-экосистемам: вы следите за тем, что появляется (LangChain/LangGraph, RAG, function/tool-calling, MCP, векторные БД, инференс LLM), и имеете аргументированное мнение, что из этого применимо у нас

  • английский на уровне чтения и написания технической документации (B1+)

Будет плюсом

  • практический опыт с LangGraph/LangChain или другими агентными фреймворками

  • опыт построения RAG-систем и работы с векторными БД (Milvus, Qdrant, pgvector и т. п..

  • опыт serving ML-моделей (Triton Inference Server, KServe, vLLM) и работа с CUDA/GPU

  • понимание пайплайнов ML и актуальных проблем NLP

  • опыт с ClickHouse, Redis, S3/MinIO, gRPC

  • бэкенд на других языках (Go, C++, Rust, Java/Kotlin и пр.); у нас адаптеры на Go

  • опыт с любыми чат-бот/агент-платформами или разработка собственных ботов и агентов

  • опыт удалённой работы в распределённой команде

Наш стек

  • Python 3.12, FastAPI, asyncio; LangGraph и LangChain 1.0, MCP (langchain-mcp-adapters),

  • LiteLLM, OpenAI-совместимые API для LLM. Инференс и ML: эмбеддинги на Triton (GPU, PyTorch),

  • serving моделей на KServe, AutoML-пайплайны. Данные и шина: Kafka, PostgreSQL, ClickHouse,

  • адаптеры, шлюзы на Go 1.25, fiber, gRPC, franz-go

  • Milvus, Redis, S3/MinIO, Clickhouse

  • Kubernetes, Helm, GitLab CI, OpenTelemetry и Prometheus

Что мы предлагаем:

  • атмосфера IT-стартапа и участие в инновационных проектах в области AI;

  • работу в сильной команде, уровень разработчиков в компании — middle+/senior и актуальный стек технологий;

  • действительно гибкий график, у нас нет обязательных дней в офисе и начала рабочего времени, команда встречается в офисе по договоренности, возможен полностью удаленный формат по РФ;

  • новый современный офис на метро Курская, если тебе все же нравится видеться иногда с коллегами;

  • программа ДМС с полным покрытием с первой недели работы, включая стоматологию и услуги телемедицины, полис для выезжающих за рубеж, страхование жизни;

  • участие в конференциях и митапах, обучение за счет компании.