Senior AI Инженер/Разработчик мультиагентной системы

Дата размещения вакансии: 20.11.2025
Работодатель: Консоль.Про
Уровень зарплаты:
от 400000 RUR
Город:
Москва
1-я улица Ямского Поля 1к1
Требуемый опыт работы:
От 3 до 6 лет

Мы создаём платформу, которая позволяет бизнесам самостоятельно настраивать и обучать AI-агентов для автоматизации клиентской поддержки. Наши агенты взаимодействуют с пользователями, обрабатывают знания, интегрируются в CRM/Helpdesk и помогают компаниям масштабировать поддержку, не теряя качества.

Сейчас мы ищем инженера, который поможет вывести платформу на новый уровень — с мультиагентной архитектурой, локальными моделями и голосовыми интерфейсами.

Что предстоит делать:

  • Проектировать и реализовывать мультиагентную архитектуру: распределение ролей между агентами, координация, состояние, память, workflow.

  • Разрабатывать инструменты (tools) на Python, которые агенты будут использовать для выполнения задач: API-вызовы, бизнес-логика, базы данных.

  • Интегрировать облачные LLM и развёртывать локальные модели: Llama, Mistral, Qwen и др.; оптимизировать inference, квантизацию, стоимость.

  • Реализовывать голосовые интерфейсы: STT/TTS, аудио-взаимодействие, логика голосового диалога.

  • Создавать платформенные возможности для клиентов: настройка агентов без кода, подключение источников знаний, сценариев, интеграций.

  • Собирать и анализировать метрики работы агентов: точность, полезность, время ответа, пользовательские KPIs; строить мониторинг, дашборды, A/B-тесты.

  • Писать чистый, поддерживаемый код; разворачивать микросервисы, API, очереди, фоновые задачи.

Требования:

  • Хорошее знание Python.

  • Опыт работы с LangGraph, LangChain или аналогичными фреймворками агентов.

  • Понимание LLM, prompt-engineering, RAG, векторных хранилищ (Weaviate, Pinecone и др.).

  • Опыт асинхронного программирования, API, вебхуков (FastAPI, aiohttp).

  • Навыки встраивания локальных моделей: inference, оптимизация, развёртывание.

  • Опыт создания и использования метрик, мониторинга и аналитики.

  • Активно использовать и интегрировать современные AI-инструменты для разработки (Cursor, AI Studio etc).

  • Уверенные навыки работы с Git-workflow, код-ревью.

  • Желательно: опыт работы с голосовыми интерфейсами (TTS/STT).

Будет плюсом:

  • Опыт дообучения локальных моделей (fine-tuning, LoRA/QLoRA).

  • Работа с vLLM, Ollama, Exllama.

  • Понимание метрик поддержки клиентов: SLA, CSAT, FCR.

  • Опыт создания low-code/no-code сред.

  • Опыт разработки систем наблюдаемости (Prometheus, Grafana, OpenTelemetry).

  • Знание Node.js и понимание архитектуры веб-приложений (frontend/back-end, REST/GraphQL, серверная логика).

Мы предлагаем:

  • Проект на пересечении AI, мультиагентных систем и платформенной инженерии.

  • Возможность влиять на архитектуру и продукт в ключевой области.

  • Офис в Москве (м. Белорусская) с комфортными условиями.

  • Работа с cutting-edge технологиями: локальные и облачные LLM, голосовые агенты, масштабируемые системы.

  • Дружелюбная команда, быстрые итерации, эксперименты.