Подсосенский переулок 23с5
MWS AI – это часть экосистемы МТС Web Services, где создаются AI-решения будущего. Здесь мы разрабатываем современные AI-решения для различных сфер: от банковской до медицины и телекома. Мы стремимся к инновациям в области речевого ИИ, видеоаналитики и Gen AI: активно занимаемся исследованиями и публикуем научные статьи. В MWS AI вы найдете профессиональное сообщество единомышленников и возможности для реализации прорывных проектов.
Мы ищем опытного AI-инженера, который сможет превратить сложные бизнес-задачи в работающие, масштабируемые AI-решения. Фокус на решении реальных бизнес-проблем, а не на исследованиях. Нам важно стратегическое мышление: умение быстро собирать PoC, валидировать их на метриках и итеративно доводить MVP до продакшена
Основные задачи:
-
Анализ и декомпозиция бизнес-задач
-
Проектирование архитектуры AI-решений совместно с командой: выбор подходящих паттернов
-
Внедрение метрик качества (точность, релевантность, время ответа), регулярный анализ результатов, формулирование гипотез, итеративное улучшение решения
-
Разработка AI-агентов и copilot-систем (оркестрация агентов, управление памятью, планирование и декомпозиция задач, умная маршрутизация)
-
Построение RAG-систем: выбор стратегий индексации, определение оптимального чанкинга, обогащение метаданными, реализация гибридного поиска и переранжирования
-
Версионирование промтов, моделей, датасетов
-
Внедрение наблюдаемости (observability) решений: трейсинг цепочек вызовов, мониторинг качества ответов, контроль затрат токенов и времени ответа
-
Взаимодействие с командой разнонаправленных специалистов (backend/devops/ml/promt-engineer)
Мы ждем от вас:
-
3+ лет прикладной AI/ML-разработки с фокусом на NLP и LLM-системы
-
Опыт с LLM API: промпт-инжиниринг, управление контекстом, streaming
-
Практический опыт с LLM-агентами: ReAct-паттерн, function calling, chain-of-thought рассуждения, multi-agent системы
-
Обязательное знание LangFlow, n8n или аналоги
-
Глубокое понимание RAG: векторный и гибридный поиск, стратегии чанкинга, переранжирование
-
Сильный Python: чистый, типизированный код, unit-тесты, асинхронное программирование, ооп, docker
-
Знание фреймворков: LangChain, LangGraph, CrewAI или аналоги
-
Векторные базы данных: Milvus, Chroma или аналоги
-
LLM observability tools: LangFuse или подобные платформы
-
Понимание микросервисной архитектуры
-
Опыт с FastAPI или аналогами
-
Способность объяснить сложные AI-концепции нетехническим стейкхолдерам
-
Будет преимуществом опыт fine-tuning и дистилляции моделей, а также понимание современных архитектур сетей
-
Практический опыт с семействами Qwen, GLM, DeepSeek и аналогами
-
Понимание принципов развёртывания LLM: инференс-серверы (vLLM, sglang), масштабирование, квантизация, GPU trade-offs
Что мы предлагаем:
- 5/2, частичная или полная удаленка, гибкое начало дня.
- Оклад + квартальные и годовые бонусы.
- Комфортный офис в 10 минутах пешком от метро Курская.
- ДМС со стоматологией, страхование при поездках за рубеж, страхование жизни.
- Участие в конференциях и митапах, обучение за счет компании.
- Бесплатная мобильная связь.
- Специальные предложения от партнеров и друзей МТС.