Data Scientist (RAG Systems) Middle+

Дата размещения вакансии: 12.03.2026
Работодатель: Трейдмарк холдер
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Data Scientist (RAG Systems) — Middle+

Направление: LLM / NLP / Information Retrieval

Формат: удалёнка

ЗП: $2000

Технологический стек: Go (обязательно), Python

Чем предстоит заниматься

• Проектировать и улучшать RAG-пайплайны: retriever → reranker → generator

• Экспериментировать с чанкингом, эмбеддингами и векторными БД (FAISS, Milvus, Pinecone, Qdrant)

• Разрабатывать компоненты retrieval-логики: query rewriting, expansion, decomposition, self-RAG, corrective RAG

• Внедрять и тюнить реранкеры (cross-encoders, ColBERT, LLM-based reranking)

• Оценивать качество системы: метрики faithfulness, answer relevance, context precision/recall, A/B-тесты

• Работать с LLM: промпт-инжиниринг; при необходимости fine-tuning / LoRA

• Оптимизировать latency и cost: кэширование, квантизация, дистилляция, подбор моделей под задачу

• Строить data pipelines для сбора, очистки и актуализации корпуса документов

Мы ожидаем

• Практический опыт в NLP/IR и портфолио с RAG/LLM-проектами

• Уверенное владение Go и Python

• Понимание информационного поиска: sparse retrieval (BM25), dense retrieval (bi-encoders), гибридные подходы

• Опыт с векторными индексами и настройкой поиска (HNSW, IVF)

• Знание методов оценки качества RAG/NLP-систем (RAGAS, DeepEval, LLM-as-a-judge)

Плюсом

• Fine-tuning эмбеддингов (Sentence Transformers) и/или LLM

• Работа с графовыми БД для Knowledge Graph RAG

• Опыт RLHF

Чтобы мы рассмотрели ваш отклик, начните ваше сопроводительное письмо со слов "ЭТО МНЕ ИНТЕРЕСНО"

В сопроводительном письме пришлите краткое описание ваших навыков в указанной сфере в произвольной форме.