Umojo - один из ведущих разработчиков платформенных решений в сфере мобильности, контакт-центров, аналитики данных и сетевой безопасности. Мы помогаем бизнесу повышать эффективность и улучшать клиентский опыт.
Платформа Umojo Nexus лежит в основе всех решений компании и помогает муниципалитетам, операторам парковок и бизнесу эффективнее работать с клиентами и городскими сервисами. Благодаря точным AI-решениям на базе камер и широкой интеграции с отраслевыми системами, Umojo предоставляет инструменты для аналитики и управления парковкой и мобильностью - как на улицах, так и вне их.
О РОЛИ
В роли Senior Python Engineer вы будете разрабатывать и внедрять голосовые LLM-агенты, формирующие новое поколение взаимодействия с пользователями - превращая миллионы ежегодных обращений в сфере парковки и мобильности в бесшовные AI-диалоги.
Это возможность с нуля строить продакшн-системы на стыке голосовых технологий, LLM и инфраструктуры реального времени.
Мы ищем опытного Python-инженера, который воспринимает GenAI как платформу для разработки решений, а не как временный тренд. Важно иметь сильное инженерное мышление, умение быстро двигаться без потери качества и быть готовым работать в среде с формирующимися процессами.
ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ:
- Проектирование и реализация пайплайнов голосовых LLM-агентов в реальном времени с интеграцией в платформу Umojo Nexus - полный цикл от дизайна до продакшна
- Разработка высоконагруженных асинхронных микросервисов на FastAPI с поддержкой одновременных голосовых сессий и задержкой менее секунды
- Проектирование и поддержка RAG-пайплайнов полного цикла: от загрузки документов и их разбиения до индексации и поиска в VectorDB
- Оркестрация логики работы AI-агентов (LangChain / LangGraph): управление состоянием, инструментами и fallback-логико
- Работа с очередями сообщений (RabbitMQ) для обработки событий
- Контейнеризация, деплой и поддержка сервисов в Docker с упором на надежность и стабильность
- Взаимодействие с продуктовой, data и платформенной командами для улучшения ключевых метрик агентов (точность, latency, first-call resolution)
ТРЕБОВАНИЯ
Обязательные:
- 6+ лет коммерческой разработки на Python. Уверенное владение AsyncIO (не базовый уровень)
- Английский язык уровня C1+ (устный и письменный) - ежедневная работа с коллегами из США
- Практический опыт работы в продакшене с FastAPI, Docker, gRPC, WebRTC и RabbitMQ или аналогичными системами очередей
- Опыт разработки LLM-агентов с использованием LangChain или LangGraph и LlamaIndex
- Подтвержденный опыт проектирования и оптимизации RAG-пайплайнов (эмбеддинги, выбор VectorDB, chunking, оптимизация поиска)
- Опыт работы как с реляционными базами данных (SQL), так и с VectorDB
Будет плюсом:
Так как архитектура ориентирована на голос, кандидаты с опытом в следующих областях будут иметь значительное преимущество:
- Опыт работы с FreeSwitch или другими SIP/телефонийными платформами
- Интеграция TTS (ElevenLabs, Google TTS, Amazon Polly и др.)
- Интеграция ASR (Deepgram, Whisper, Google STT и др.)
- Оптимизация и ускорение работы моделей (квантование, дообучение, vLLM, ONNX, TensorRT)
УСЛОВИЯ:
- Контракт напрямую с компанией
- Полная удалёнка, гибкий график
- Корпоративный ноутбук
- Доступ к передовым AI-инструментам и инфраструктуре
- Нерабочие дни по ТК РФ, оплачиваемы отпуск, больничные, sick days