Python, FastAPI, SQLAlchemy, asyncpg, PostgreSQL, Alembic
GUI-OWL (UI-TARS), GPT-5-mini, Claude (Anthropic Computer Use API), vLLM, OpenAI-совместимые API
собственные CUA-пайплайны (GUI-Owl, UI-TARS agent loop, Anthropic computer-use)
Docker, Docker Compose, S3 (логи и скриншоты), VNC, управление виртуальными машинами через Docker API
-
Развивать и оптимизировать CUA-агентов: повышать accuracy прохождения сценариев, уменьшать количество шагов, улучшать обработку edge-кейсов (капчи, нестандартные UI, динамический контент).
-
Проектировать и внедрять новые агентные пайплайны (multi-agent, judge-based архитектуры).
-
Работать с vision-language моделями (UI-TARS, Claude Vision): подбор, fine-tuning, prompt engineering, оценка качества.
-
Интегрировать и деплоить LLM-сервисы (vLLM, OpenAI API, Anthropic API), оптимизировать инференс (tensor parallelism, batching).
-
Участвовать в масштабировании системы: увеличение количества одновременно обрабатываемых задач, параллелизация задач, управление ресурсами виртуальных машин.
-
Работать с данными: парсинг, структурирование результатов, интеграция с PostgreSQL и S3.
Требования:
Обязательно:
-
Опыт работы с LLM в продакшн-окружении (prompt engineering, function calling, structured output).
-
Опыт построения AI-агентов (LangChain / LangGraph / ReAct / Tools).
-
Понимание архитектуры и принципов работы CUA / GUI-агентов (Anthropic Computer Use, UI-TARS или аналоги).
-
Уверенное владение Python (asyncio, FastAPI или аналогичные фреймворки).
-
Опыт работы с Docker (сборка образов, docker-compose, управление контейнерами).
-
Умение читать и воспроизводить результаты ML-research (статьи, бенчмарки, open-source модели).
Будет плюсом:
-
Опыт деплоя и оптимизации LLM-инференса (vLLM, TGI, tensor parallelism).
-
Опыт fine-tuning vision-language моделей.
-
Знакомство с multi-agent системами и оркестрацией агентов.
-
Опыт работы с Anthropic API (в т.ч. Computer Use).
-
Понимание веб-автоматизации (Selenium, Playwright, pyautogui).
-
Опыт работы с PostgreSQL, SQLAlchemy, Alembic.
Условия:
-
Работа над R&D-проектом в области AI-агентов и LLM-систем.
-
Современный стек: Python, LLM-сервисы, vision-language модели, агентные архитектуры.
-
Возможность работать с передовыми решениями в области Computer Use Agents.
- Удаленный формат работы из любого города или страны
- График работы 5/2
- Отпуск - 28 календарных дней.