з/п не указана
Москва
Ленинградское шоссе 16Ас2
Ленинградское шоссе 16Ас2
Более 6 лет
Наш стек
- Python (FastAPI / Flask), PostgreSQL, Redis
- LLM/GenAI: OpenAI, Anthropic, open-source модели
- Фреймворки: LangChain, LangGraph, LlamaIndex
- Векторные БД: Qdrant / FAISS
- Инфраструктура: Docker, Kubernetes, CI/CD, очереди (Kafka / RabbitMQ / Celery)
Чем предстоит заниматься
- Разрабатывать и внедрять GenAI/LLM-решения в продуктовые сервисы
- Строить backend для AI-функциональности и интеграции с внешними системами
- Развивать RAG-пайплайны: индексация, retrieval, качество и стоимость
- Реализовывать агентные сценарии (multi-step, tool calling, memory)
- Обеспечивать стабильность сервисов: мониторинг, ошибки, performance
- Оценивать и улучшать качество моделей (метрики, тесты, итерации)
Что мы ждём:
- 3+ года опыта в AI / LLM / backend-разработке или сильные production-кейсы
- Уверенный Python (async, ООП) и опыт разработки API
- Практический опыт с LLM: prompt engineering, embeddings, работа с API
- Опыт построения RAG-пайплайнов и работы с векторными БД
- Понимание backend-архитектуры и распределённых систем (очереди, сервисы, интеграции)
- Опыт доведения решений до production (Docker, логирование, мониторинг)
Будет плюсом
- Опыт production-внедрения AI-ассистентов или LLM-решений
- Опыт fine-tuning моделей (LoRA, PEFT) или оптимизации inference
- Знание evaluation-подходов (RAGAS, DeepEval или аналоги)
- Опыт работы в финтехе или среде с высокими требованиями к безопасности