Разработчик ML/LLM

Дата размещения вакансии: 10.04.2026
Работодатель: Ри-Адванс
Уровень зарплаты:
з/п не указана
Город:
Москва
Кировоградская улица 23Ак1
Требуемый опыт работы:
От 1 года до 3 лет

Мы ищем разработчика, который поможет нам автоматизировать создание качественных изображений. Ваша задача — построить систему пакетной обработки/генерации изображений.

Что предстоит делать:

  • развернуть и поддерживать локальную AI‑инфраструктуру для генерации изображений;
  • настраивать и оптимизировать пайплайны на базе ComfyUI / Stable Diffusion / ControlNet / SDXL / Flux / SD3 для пакетной обработки изображений;
  • обучать собственные чекпоинты и дорабатывать существующие модели под специфику продукта — чтобы сохранять форму объекта, получать чистый фон и единый стиль изображений;
  • настраивать масштабирование (multi-worker / multi-GPU);
  • экспериментировать с разными моделями генерации (SDXL, Flux, SD3 и др.), чтобы найти оптимальное соотношение качества и скорости;
  • развивать DevOps‑pipeline для ML/LLM‑сервисов: настраивать CI/CD, управлять версиями моделей и конфигураций, обеспечивать безопасные релизы, проводить A/B‑тесты и быстрый rollback;
  • настроить систему мониторинга нагрузки на GPU, времени генерации и ошибок (например, с помощью Prometheus + Grafana);
  • организовать систему очередей задач генерации и балансировку нагрузки между узлами;
  • взаимодействовать с бэкенд для интеграции ML‑решений в API‑сервисы (работа с FastAPI, очередями и кэшированием);
  • использовать OpenCV и PIL/Pillow для предобработки входных изображений (вырезание фона, выравнивание, нормализация) и постобработки сгенерированных;
  • оптимизировать скорость генерации с помощью TensorRT для ускорения инференса на GPU;
  • организовать хранение исходных и сгенерированных изображений,
    а также чекпоинтов моделей в S3‑совместимых хранилищах.

Чего мы ждём от вас:

  • уверенные знания Python(asyncio, aiohttp/FastAPI), PyTorch;
  • глубокий опыт работы с ComfyUI на продакшн‑уровне;
  • хорошее понимание микросервисной архитектуры и event‑driven подхода;
  • понимание принципов работы diffusion‑моделей и методов fine‑tuning;
  • опыт обучения собственных чекпоинтов для моделей SDXL / SD 1.5 / Flux / SD3 или аналогичных;
  • опыт самостоятельного обучения LoRA, DreamBooth, Textual Inversion;
  • умение добиваться консистентности между разными генерациями (сохранять ключевые признаки объекта);
  • опыт работы с инструментами управления композицией — ControlNet, IP‑Adapter, StyleAdapter;
  • опыт использования OpenCV или PIL/Pillow для обработки изображений;
  • знакомство с TensorRT или другими инструментами оптимизации инференса для ускорения генерации;
  • опыт работы с S3‑совместимыми хранилищами;
  • понимание принципов построения REST API и интеграции с бэкендом;
  • опыт работы с PostgreSQL (оптимизация сложных запросов, проектирование схем);
  • опыт развёртывания и поддержки локальной AI‑инфраструктуры, включая:
    • работу с GPU‑серверами (NVIDIA, CUDA) и оптимизацию использования ресурсов;
    • работу с Docker и Docker Compose;
    • навыки оркестрации контейнеров (Kubernetes — будет плюсом);
    • понимание принципов мониторинга ML‑систем (Prometheus, Grafana или аналоги);
    • навыки работы с Redis (кэширование, сессии, очереди);
    • опыт построения отказоустойчивых систем и организации резервного копирования.

Что мы предлагаем:

  • работа с высоконагруженной системой генерации изображений;
  • возможность экспериментировать с самыми свежими моделями и архитектурами;
  • минимум бюрократии — вы сможете сосредоточиться на решении интересных задач;
  • шанс внести вклад в создание заметного и инновационного продукта.