з/п не указана
Новосибирск
От 1 года до 3 лет
Обязанности:
- Разработка и развитие RAG-систем
- Интеграция LLM через API (OpenAI, open-source модели и др.)
- Построение пайплайнов обработки данных и контекста
- Работа с MCP (Model Context Protocol) и инструментами вокруг него
- Разработка backend-сервисов на Python для AI-фич
- Интеграция векторных баз данных (поиск, индексация, оптимизация)
- Оркестрация агентов и инструментов (tool use, function calling)
- Оптимизация latency, стоимости и качества ответов моделей
- Мониторинг и логирование AI-систем.
Требования:
- Уверенный Python (backend / сервисы)
- Опыт построения или использования RAG-систем
- Понимание работы LLM (prompting, контекст, токены, ограничения)
- Опыт работы с API моделей
- Знание одной или нескольких векторных БД (Qdrant, Weaviate, FAISS и др.)
- Опыт работы с Docker, K8S
- Опыт с MCP или похожими протоколами
- LangChain / LlamaIndex или аналогичные фреймворки
- Опыт построения AI-агентов
- Работа с потоками данных (Kafka, очереди).