• Уверенное знание Python (предпочтительно) или другого современного backend-языка программирования.
• Опыт разработки и поддержки REST API и серверной архитектуры.
• Глубокое понимание принципов prompt engineering для больших языковых моделей (LLM), особенно в задачах генерации длинных текстов.
• Практический опыт взаимодействия с LLM, развернутыми на собственных серверах (LLaMA, Mistral, Qwen и др.).
• Знание и опыт работы с LangChain для создания цепочек, агентов, работы с памятью и инструментами.
• Понимание принципов работы векторных баз данных (например, FAISS, Chroma) и эмбеддингов для реализации RAG (retrieval-augmented generation).
• Умение работать с Docker, Git, базовые навыки администрирования серверов на Linux.
• Знание особенностей токенизации, окон контекста и оптимизации вывода LLM без дообучения.
• Умение самостоятельно организовывать архитектуру backend-систем под AI-ориентированные задачи.
• Чистый, структурированный код, хорошая документация, уверенные навыки отладки.
Условия:
- Удаленная работа;
- ЗП по договоренности