Data Scientist (RAG Systems) — Middle+
Направление: LLM / NLP / Information Retrieval
Формат: удалёнка
ЗП: $2000
Технологический стек: Go (обязательно), Python
Чем предстоит заниматься
• Проектировать и улучшать RAG-пайплайны: retriever → reranker → generator
• Экспериментировать с чанкингом, эмбеддингами и векторными БД (FAISS, Milvus, Pinecone, Qdrant)
• Разрабатывать компоненты retrieval-логики: query rewriting, expansion, decomposition, self-RAG, corrective RAG
• Внедрять и тюнить реранкеры (cross-encoders, ColBERT, LLM-based reranking)
• Оценивать качество системы: метрики faithfulness, answer relevance, context precision/recall, A/B-тесты
• Работать с LLM: промпт-инжиниринг; при необходимости fine-tuning / LoRA
• Оптимизировать latency и cost: кэширование, квантизация, дистилляция, подбор моделей под задачу
• Строить data pipelines для сбора, очистки и актуализации корпуса документов
Мы ожидаем
• Практический опыт в NLP/IR и портфолио с RAG/LLM-проектами
• Уверенное владение Go и Python
• Понимание информационного поиска: sparse retrieval (BM25), dense retrieval (bi-encoders), гибридные подходы
• Опыт с векторными индексами и настройкой поиска (HNSW, IVF)
• Знание методов оценки качества RAG/NLP-систем (RAGAS, DeepEval, LLM-as-a-judge)
Плюсом
• Fine-tuning эмбеддингов (Sentence Transformers) и/или LLM
• Работа с графовыми БД для Knowledge Graph RAG
• Опыт RLHF
Чтобы мы рассмотрели ваш отклик, начните ваше сопроводительное письмо со слов "ЭТО МНЕ ИНТЕРЕСНО"
В сопроводительном письме пришлите краткое описание ваших навыков в указанной сфере в произвольной форме.