Разработчик ML/LLM

Дата размещения вакансии: 10.04.2026

Работодатель: Ри-Адванс

Уровень зарплаты:

з/п не указана

Город:

Москва
Кировоградская улица 23Ак1

Требуемый опыт работы:

От 1 года до 3 лет

Мы ищем разработчика, который поможет нам автоматизировать создание качественных изображений. Ваша задача — построить систему пакетной обработки/генерации изображений.

Что предстоит делать:

развернуть и поддерживать локальную AI‑инфраструктуру для генерации изображений;
настраивать и оптимизировать пайплайны на базе ComfyUI / Stable Diffusion / ControlNet / SDXL / Flux / SD3 для пакетной обработки изображений;
обучать собственные чекпоинты и дорабатывать существующие модели под специфику продукта — чтобы сохранять форму объекта, получать чистый фон и единый стиль изображений;
настраивать масштабирование (multi-worker / multi-GPU);
экспериментировать с разными моделями генерации (SDXL, Flux, SD3 и др.), чтобы найти оптимальное соотношение качества и скорости;
развивать DevOps‑pipeline для ML/LLM‑сервисов: настраивать CI/CD, управлять версиями моделей и конфигураций, обеспечивать безопасные релизы, проводить A/B‑тесты и быстрый rollback;
настроить систему мониторинга нагрузки на GPU, времени генерации и ошибок (например, с помощью Prometheus + Grafana);
организовать систему очередей задач генерации и балансировку нагрузки между узлами;
взаимодействовать с бэкенд для интеграции ML‑решений в API‑сервисы (работа с FastAPI, очередями и кэшированием);
использовать OpenCV и PIL/Pillow для предобработки входных изображений (вырезание фона, выравнивание, нормализация) и постобработки сгенерированных;
оптимизировать скорость генерации с помощью TensorRT для ускорения инференса на GPU;
организовать хранение исходных и сгенерированных изображений,
а также чекпоинтов моделей в S3‑совместимых хранилищах.

Чего мы ждём от вас:

уверенные знания Python(asyncio, aiohttp/FastAPI), PyTorch;
глубокий опыт работы с ComfyUI на продакшн‑уровне;
хорошее понимание микросервисной архитектуры и event‑driven подхода;
понимание принципов работы diffusion‑моделей и методов fine‑tuning;
опыт обучения собственных чекпоинтов для моделей SDXL / SD 1.5 / Flux / SD3 или аналогичных;
опыт самостоятельного обучения LoRA, DreamBooth, Textual Inversion;
умение добиваться консистентности между разными генерациями (сохранять ключевые признаки объекта);
опыт работы с инструментами управления композицией — ControlNet, IP‑Adapter, StyleAdapter;
опыт использования OpenCV или PIL/Pillow для обработки изображений;
знакомство с TensorRT или другими инструментами оптимизации инференса для ускорения генерации;
опыт работы с S3‑совместимыми хранилищами;
понимание принципов построения REST API и интеграции с бэкендом;
опыт работы с PostgreSQL (оптимизация сложных запросов, проектирование схем);
опыт развёртывания и поддержки локальной AI‑инфраструктуры, включая:
- работу с GPU‑серверами (NVIDIA, CUDA) и оптимизацию использования ресурсов;
- работу с Docker и Docker Compose;
- навыки оркестрации контейнеров (Kubernetes — будет плюсом);
- понимание принципов мониторинга ML‑систем (Prometheus, Grafana или аналоги);
- навыки работы с Redis (кэширование, сессии, очереди);
- опыт построения отказоустойчивых систем и организации резервного копирования.

Что мы предлагаем:

работа с высоконагруженной системой генерации изображений;
возможность экспериментировать с самыми свежими моделями и архитектурами;
минимум бюрократии — вы сможете сосредоточиться на решении интересных задач;
шанс внести вклад в создание заметного и инновационного продукта.

Откликнуться

Разработчик ML/LLM

Похожие вакансии: Москва