з/п не указана
Москва
Летниковская улица 10с4
Летниковская улица 10с4
От 3 до 6 лет
Обязанности:
- Проектировать и разрабатывать RAG-пайплайны (Retrieval-Augmented Generation) для задач question-answering, поиска и суммаризации документов
- Интегрировать LLM (локальные модели) с использованием фреймворков (LangChain)
- Работать с векторными базами данных для эффективного хранения и поиска эмбеддингов
- Проводить оценку качества RAG-систем: применять метрики, разрабатывать собственные тестовые сценарии
- Внедрять мониторинг и observability для LLM-приложений с помощью LangFuse (отслеживание промптов, трассировка, анализ стоимости и задержек)
- Обеспечивать безопасность LLM-систем: внедрять практики LLMSecOps (защита от prompt injection, санитизация входных данных, контроль доступа к моделям, аудит логов)
- Разрабатывать и поддерживать классические ML-модели для задач классификации, регрессии, кластеризации — встраивать их в продуктовую архитектуру
- Оптимизировать производительность инференса моделей
Требования:
- Опыт разработки на Python от 3 лет
- Знание асинхронного программирования (asyncio/aiohttp) будет плюсом
- Глубокое понимание принципов работы LLM, трансформеров, эмбеддингов, методов промпт-инжиниринга
- LLM в проде: понимание токенизации/контекста и ограничений, типовых failure-modes; понимание, когда уместна адаптация модели (PEFT/LoRA/QLoRA) и как оценивать влияние на качество/производительность.
- RAG / knowledge Q&A: практический опыт построения решений на базе корпоративных данных: эмбеддинги, retrieval (векторный/гибридный), reranking, grounding/цитирование, контроль качества.
- Инструменты LLM: HuggingFace + LangChain/LlamaIndex (или аналоги); опыт построения agentic/non-agentic пайплайнов с tool/function calling (контракты инструментов, устойчивость вызовов).
- Backend и интеграции: сильный Python; сервисы и API (FastAPI или аналоги), очереди/воркеры/фоновые задачи, интеграции с внутренними системами; тесты и сопровождение.
- Production/observability: логи/метрики/трейсы (Grafana/Prometheus или аналоги), диагностика инцидентов и деградаций качества/производительности.
- Инфраструктура: Linux/CLI; Kubernetes на уровне чтения манифестов/логов и участия в диагностике.
Условия:
- Оформление по ТК, белая заработная плата
- Оплачиваем питание в офисе
- ДМС, страховка жизни и несчастных случаев, страховка от онкозаболеваний
- Ежегодная индексация оклада
- Годовая премия 10% от годового оклада
- Софинансирование фитнеса
- Корпоративные курсы английского языка
- Оплата обучения до 100 000 р в год