Senior Python Backend Developer, AI Agents Platform (MWS AI)

Дата размещения вакансии: 22.06.2026

Работодатель: МТС

Уровень зарплаты:

з/п не указана

Город:

Москва
Подсосенский переулок 23с5

Требуемый опыт работы:

Более 6 лет

MTS AI – это отдельная компания внутри экосистемы МТС. У нас царит атмосфера стартапа, новые продукты, никакого легаси, небольшие команды, с дружественной атмосферой.

Мы разрабатываем AI-решения и продукты, используя технологии обработки и синтеза естественного языка, компьютерного зрения и edge computing. Формируем AI-сообщество, сотрудничаем с ведущими технологическими компаниями и международными экспертами, проводим исследования, инвестируем в перспективные проекты и команды.

О продукте

Мы строим отказоустойчивую масштабируемую облачную платформу для создания и эксплуатации диалоговых AI-ассистентов: no-code конструктор агентов, оркестрация диалога, RAG, AutoML/MLOps и многоканальная доставка сообщений. Самих ботов и агентов под конкретного заказчика мы не пишем: мы делаем движок и инфраструктуру, на которых их собирают и гоняют в проде.

Сейчас к нам в команду мы ищем эксперта разработки, который возьмёт на себя самые критичные и нагруженные части платформы. Нам важен не только сильный инженер, но и человек, кому интересно, как индустрия агентов взрослеет на глазах: от prompt- к context engineering, от одиночного бота к мульти-агентным системам, MCP и A2A как новые стандарты, память и eval агентов, reasoning-модели, эффективный serving (vLLM/SGLang). Вы это не просто читаете в ленте,а пробуете руками.

Над чем будете работать

оркестратор диалога на LangGraph (граф сценариев, чекпоинтинг состояния, tool-calling, интеграция с LLM). Это сердце платформы и одна из самых нагруженных её частей
планирование и выполнение многошаговых задач, субагенты и мульти-агентная оркестрация
развитие долговременной памяти агентов, изолированные сэндбоксы для исполнения кода и инструментов, guardrails и контроль действий
парсинг и чанкинг документов, индексация и гибридный/семантический поиск в Milvus
рантайм диалога на Kafka: обработка входящих сообщений, маршрутизация ответов в каналы, поток событий диалога в аналитику
оценка качества агентов, наблюдаемость

Чем предстоит заниматься

реализовывать высоконагруженные бэкенды критичной бизнес-логики
быть владельцем кода одного или нескольких сервисов и отвечать за его качество, производительность, отказоустойчивость и документированность.
прототипировать и исследовать подходы (новые модели, фреймворки агентов, способы инференса), чтобы обоснованно выбирать решения, а не следовать хайпу
по желанию и в перспективе расти в техлида или тимлида продукта

Мы ожидаем от вас

релевантный опыт backend-разработки от 5 лет с Python как основным языком на экспертном уровне (у нас 3.12): понимаете не только как писать, но и как и почему оно работает под капотом
глубокое понимание async-модели: где asyncio даёт выигрыш, а где только добавляет сложности, как не положить event loop блокирующим вызовом и как дебажить асинхронный код под нагрузкой; опыт с async-фреймворком (у нас FastAPI)
опыт проектирования и эксплуатации высоконагруженных и отказоустойчивых сервисов (нагрузка, конкурентность, backpressure, деградация, идемпотентность)
уверенная работа с микросервисами и брокерами сообщений (у нас Kafka)
опыт с реляционными БД (у нас PostgreSQL); понимание, чем платить за консистентность и как не положить базу под нагрузкой
алгоритмы и структуры данных, ООП, SOLID, чистый читаемый код, code review, юнит-тесты
devOps-культура: CI/CD,gitlab, docker, kubernetes, консоль
интерес к домену агентов и актуальным ии-экосистемам: вы следите за тем, что появляется (LangChain/LangGraph, RAG, function/tool-calling, MCP, векторные БД, инференс LLM), и имеете аргументированное мнение, что из этого применимо у нас
английский на уровне чтения и написания технической документации (B1+)

Будет плюсом

практический опыт с LangGraph/LangChain или другими агентными фреймворками
опыт построения RAG-систем и работы с векторными БД (Milvus, Qdrant, pgvector и т. п..
опыт serving ML-моделей (Triton Inference Server, KServe, vLLM) и работа с CUDA/GPU
понимание пайплайнов ML и актуальных проблем NLP
опыт с ClickHouse, Redis, S3/MinIO, gRPC
бэкенд на других языках (Go, C++, Rust, Java/Kotlin и пр.); у нас адаптеры на Go
опыт с любыми чат-бот/агент-платформами или разработка собственных ботов и агентов
опыт удалённой работы в распределённой команде

Наш стек

Python 3.12, FastAPI, asyncio; LangGraph и LangChain 1.0, MCP (langchain-mcp-adapters),
LiteLLM, OpenAI-совместимые API для LLM. Инференс и ML: эмбеддинги на Triton (GPU, PyTorch),
serving моделей на KServe, AutoML-пайплайны. Данные и шина: Kafka, PostgreSQL, ClickHouse,
адаптеры, шлюзы на Go 1.25, fiber, gRPC, franz-go
Milvus, Redis, S3/MinIO, Clickhouse
Kubernetes, Helm, GitLab CI, OpenTelemetry и Prometheus

Что мы предлагаем:

атмосфера IT-стартапа и участие в инновационных проектах в области AI;
работу в сильной команде, уровень разработчиков в компании — middle+/senior и актуальный стек технологий;
действительно гибкий график, у нас нет обязательных дней в офисе и начала рабочего времени, команда встречается в офисе по договоренности, возможен полностью удаленный формат по РФ;
новый современный офис на метро Курская, если тебе все же нравится видеться иногда с коллегами;
программа ДМС с полным покрытием с первой недели работы, включая стоматологию и услуги телемедицины, полис для выезжающих за рубеж, страхование жизни;
участие в конференциях и митапах, обучение за счет компании.

Откликнуться

Senior Python Backend Developer, AI Agents Platform (MWS AI)

Похожие вакансии: Москва