Подсосенский переулок 23с5
MTS AI – это отдельная компания внутри экосистемы МТС. У нас царит атмосфера стартапа, новые продукты, никакого легаси, небольшие команды, с дружественной атмосферой.
Мы разрабатываем AI-решения и продукты, используя технологии обработки и синтеза естественного языка, компьютерного зрения и edge computing. Формируем AI-сообщество, сотрудничаем с ведущими технологическими компаниями и международными экспертами, проводим исследования, инвестируем в перспективные проекты и команды.
О продукте
Мы строим отказоустойчивую масштабируемую облачную платформу для создания и эксплуатации диалоговых AI-ассистентов: no-code конструктор агентов, оркестрация диалога, RAG, AutoML/MLOps и многоканальная доставка сообщений. Самих ботов и агентов под конкретного заказчика мы не пишем: мы делаем движок и инфраструктуру, на которых их собирают и гоняют в проде.
Сейчас к нам в команду мы ищем эксперта разработки, который возьмёт на себя самые критичные и нагруженные части платформы. Нам важен не только сильный инженер, но и человек, кому интересно, как индустрия агентов взрослеет на глазах: от prompt- к context engineering, от одиночного бота к мульти-агентным системам, MCP и A2A как новые стандарты, память и eval агентов, reasoning-модели, эффективный serving (vLLM/SGLang). Вы это не просто читаете в ленте,а пробуете руками.
Над чем будете работать
-
оркестратор диалога на LangGraph (граф сценариев, чекпоинтинг состояния, tool-calling, интеграция с LLM). Это сердце платформы и одна из самых нагруженных её частей
-
планирование и выполнение многошаговых задач, субагенты и мульти-агентная оркестрация
-
развитие долговременной памяти агентов, изолированные сэндбоксы для исполнения кода и инструментов, guardrails и контроль действий
-
парсинг и чанкинг документов, индексация и гибридный/семантический поиск в Milvus
-
рантайм диалога на Kafka: обработка входящих сообщений, маршрутизация ответов в каналы, поток событий диалога в аналитику
-
оценка качества агентов, наблюдаемость
Чем предстоит заниматься
-
реализовывать высоконагруженные бэкенды критичной бизнес-логики
-
быть владельцем кода одного или нескольких сервисов и отвечать за его качество, производительность, отказоустойчивость и документированность.
-
прототипировать и исследовать подходы (новые модели, фреймворки агентов, способы инференса), чтобы обоснованно выбирать решения, а не следовать хайпу
-
по желанию и в перспективе расти в техлида или тимлида продукта
Мы ожидаем от вас
-
релевантный опыт backend-разработки от 5 лет с Python как основным языком на экспертном уровне (у нас 3.12): понимаете не только как писать, но и как и почему оно работает под капотом
-
глубокое понимание async-модели: где asyncio даёт выигрыш, а где только добавляет сложности, как не положить event loop блокирующим вызовом и как дебажить асинхронный код под нагрузкой; опыт с async-фреймворком (у нас FastAPI)
-
опыт проектирования и эксплуатации высоконагруженных и отказоустойчивых сервисов (нагрузка, конкурентность, backpressure, деградация, идемпотентность)
-
уверенная работа с микросервисами и брокерами сообщений (у нас Kafka)
-
опыт с реляционными БД (у нас PostgreSQL); понимание, чем платить за консистентность и как не положить базу под нагрузкой
-
алгоритмы и структуры данных, ООП, SOLID, чистый читаемый код, code review, юнит-тесты
-
devOps-культура: CI/CD,gitlab, docker, kubernetes, консоль
-
интерес к домену агентов и актуальным ии-экосистемам: вы следите за тем, что появляется (LangChain/LangGraph, RAG, function/tool-calling, MCP, векторные БД, инференс LLM), и имеете аргументированное мнение, что из этого применимо у нас
-
английский на уровне чтения и написания технической документации (B1+)
Будет плюсом
-
практический опыт с LangGraph/LangChain или другими агентными фреймворками
-
опыт построения RAG-систем и работы с векторными БД (Milvus, Qdrant, pgvector и т. п..
-
опыт serving ML-моделей (Triton Inference Server, KServe, vLLM) и работа с CUDA/GPU
-
понимание пайплайнов ML и актуальных проблем NLP
-
опыт с ClickHouse, Redis, S3/MinIO, gRPC
-
бэкенд на других языках (Go, C++, Rust, Java/Kotlin и пр.); у нас адаптеры на Go
-
опыт с любыми чат-бот/агент-платформами или разработка собственных ботов и агентов
-
опыт удалённой работы в распределённой команде
Наш стек
-
Python 3.12, FastAPI, asyncio; LangGraph и LangChain 1.0, MCP (langchain-mcp-adapters),
-
LiteLLM, OpenAI-совместимые API для LLM. Инференс и ML: эмбеддинги на Triton (GPU, PyTorch),
-
serving моделей на KServe, AutoML-пайплайны. Данные и шина: Kafka, PostgreSQL, ClickHouse,
-
адаптеры, шлюзы на Go 1.25, fiber, gRPC, franz-go
-
Milvus, Redis, S3/MinIO, Clickhouse
-
Kubernetes, Helm, GitLab CI, OpenTelemetry и Prometheus
Что мы предлагаем:
-
атмосфера IT-стартапа и участие в инновационных проектах в области AI;
-
работу в сильной команде, уровень разработчиков в компании — middle+/senior и актуальный стек технологий;
-
действительно гибкий график, у нас нет обязательных дней в офисе и начала рабочего времени, команда встречается в офисе по договоренности, возможен полностью удаленный формат по РФ;
-
новый современный офис на метро Курская, если тебе все же нравится видеться иногда с коллегами;
-
программа ДМС с полным покрытием с первой недели работы, включая стоматологию и услуги телемедицины, полис для выезжающих за рубеж, страхование жизни;
-
участие в конференциях и митапах, обучение за счет компании.