от 240000 до 240000 RUR
Москва
От 3 до 6 лет
Ищем сильного разработчика с опытом работы с LLM и браузерной автоматизацией для создания MVP диалоговой AI-системы персонализированного общения.
Задача:
- Развёртывание и интеграция self-hosted LLM (LLaMA) через vLLM или аналог
- Оптимизация инференса для real-time диалоговой системы
- Реализовать backend (чат, сессии, API)
- Настроить поведение модели и prompt engineering
- Проектирование архитектуры памяти и профилей пользователей (PostgreSQL / Redis, история диалогов, профиль пользователя)
- Браузерная автоматизация через Playwright с имитацией человеческого поведения (работа с прокси, подмена fingerprint)
- Telegram-бот для операционных уведомлений
- Интеграция всех компонентов системы в единый pipeline
- Быстро фиксить проблемы по результатам тестов
Цель: запуск MVP за короткий срок, который можно тестировать в реальных диалогах
Требования:
Обязательно:
- Опыт работы с LLM (open-source модели)
- Понимание prompt engineering
- Опыт backend-разработки 3+года (Python)
- Опыт браузерной автоматизации (Playwright / Puppeteer)
- Понимание антидетект техник
- Понимание работы API, очередей, БД
- Умение быстро собирать MVP
Плюсом будет:
- Опыт с vLLM / TGI / Ollama
- Работа с LLaMA / Qwen / Mistral
- Опыт с антидетект браузерами (Dolphin Anty / AdsPower)
- Опыт с LoRA / fine-tuning
- Понимание memory систем (RAG, embeddings)
- Опыт работы с high-load чатами
Стек:
- Python (FastAPI)
- vLLM / HuggingFace
- Playwright
- PostgreSQL / Redis
- Docker
Что важно
-
Скорость > идеальность
-
Самостоятельность, задачи формулируются на уровне продукта, не технического задания
-
Участие в продуктовых обсуждениях и предложение технических решений
Условия:
- Удалённая работа
- Проектное сотрудничество (ГПХ / самозанятый / ИП)
- Быстрый старт