з/п не указана
Москва
От 3 до 6 лет
О проекте: Строим AI-систему персонализированного общения. Нужен человек который умеет работать с LLM, проектировать сложную логику на уровне продукта и координировать небольшую команду разработчиков.
Задачи:
- Проектирование общей архитектуры системы
- Декомпозиция задач для команды и контроль интеграции всех компонентов
- Развёртывание и интеграция self-hosted LLM (LLaMA) через vLLM или аналог
- Prompt engineering - настройка поведения модели, адаптация сообщений под профиль пользователя
- Перевод и адаптация сообщений в real-time
- Проектирование архитектуры памяти и профилей пользователей (PostgreSQL / Redis)
- API между frontend и backend (WebSocket для real-time)
- Техническая точка входа для продакта
Требования:
Обязательно:
- Python 3+ года
- Опыт технического лидерства на проектах обязателен
- Опыт работы с LLM (open-source модели) обязателен
- Prompt engineering обязателен
- PostgreSQL / Redis
- FastAPI + WebSocket
- Умение объяснять технические решения на уровне продукта
- Самостоятельность - задачи формулируются на уровне продукта, не технического задания
Плюсом:
- Опыт с vLLM / Ollama / TGI
- Работа с LLaMA / Qwen / Mistral
- RAG, embeddings, memory системы
- High-load чаты
Стек:
- Python (FastAPI)
- vLLM / HuggingFace
- PostgreSQL / Redis
- Docker
- WebSocket
Условия:
- Удалённо
- Проектное сотрудничество с возможностью перехода в долгосрочную работу
- Быстрый старт
В отклике укажите:
- Ссылки на проекты где работали с LLM
- Ссылки на проекты где проектировали архитектуру
- GitHub (если есть)