Data Scientist (RAG Systems) — Middle+ / Senior

Дата размещения вакансии: 24.03.2026
Работодатель: Трейдмарк холдер
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Data Scientist (RAG Systems) — Middle+ / Senior

Направление: LLM / NLP / Information Retrieval

Формат: удалёнка

ЗП: $4000

Технологический стек: Python

Чем предстоит заниматься

• Проектировать и улучшать многоступенчатые RAG-пайплайны: retriever → reranker → generator

• Экспериментировать с чанкингом, эмбеддингами и векторными БД (Weaviate, Qdrant, FAISS) — включая гибридный поиск (BM25 + vector)

• Разрабатывать компоненты retrieval-логики: query rewriting, expansion, decomposition, self-RAG, corrective RAG

Внедрять и тюнить реранкеры (cross-encoders, ColBERT, LLM-based reranking)

• Оценивать качество системы: Recall@K, MRR, NDCG, faithfulness, answer relevance, citation accuracy, A/B-тесты

• Работать с LLM: промпт-инжиниринг, извлечение структурированной информации из документов; при необходимости fine-tuning / LoRA

• Оптимизировать latency и cost: кэширование, квантизация, дистилляция, подбор моделей под задачу

• Строить data pipelines для инжеста, парсинга и обогащения корпуса документов

Мы ожидаем

3+ года практического опыта в NLP/IR и портфолио с RAG/LLM-проектами

Уверенное владение Python

Глубокое понимание информационного поиска: sparse retrieval (BM25), dense retrieval (bi-encoders), гибридные подходы

Опыт с векторными индексами и настройкой поиска (HNSW, IVF, фильтрация по метаданным)

Знание методов оценки качества RAG/NLP-систем (RAGAS, DeepEval, LLM-as-a-judge)

Чтобы мы рассмотрели ваш отклик пришлите краткое описание ваших навыков в указанной сфере в произвольной форме.