130000 до 300000 RUR
от
Барнаул
улица Короленко 75
улица Короленко 75
Обязанности:
-
Спроектировать и собрать прототип оффлайн RAG для корпуса школьных учебников.•Организовать пайплайн данных: конвертация (PDF/DOCX → текст)(опционально),очистка(опционально), предобработка, чанкинг.•Выбрать и настроить векторное хранилище (например, ChromaDB / FAISS / Qdrant /Weaviate).•Подобрать модель эмбеддингов и построить ретривер; при необходимости —добавить переранжирование.•Интегрировать локальную LLM в формате .gguf (через llama.cpp / llama‑cpp‑python) вцепочку: запрос → поиск → формирование промпта → генерация ответа.•Определить и измерять метрики: точность/полнота поиска (Precision/Recall@k, MRR),релевантность ответов, доля галлюцинаций.•Исследовать целесообразность fine‑tuning (LoRA/QLoRA); при подтверждении пользы— запустить контролируемые эксперименты.•Подготовить документацию и инструкции по развёртыванию, обновлению иэксплуатации.
Требования:
-
Требования — Hard skills•Практический опыт с LLM и локальным инференсом.•Глубокое понимание RAG (ретривер, генератор, контекстные окна, подборнегативов, переранжирование).•Опыт работы с векторными БД: ChromaDB, FAISS, Qdrant, Weaviate (одна илинесколько).•Опыт с quantized‑моделями и стеком ggml / llama.cpp; понимание формата .gguf.•NLP‑базис: чанкинг, токенизация, эмбеддинги (например, sentence‑transformers).•Уверенный Python и экосистема (poetry/venv, pytest, logging, CLI).•Опыт/понимание fine‑tuning (желательно LoRA/QLoRA).•Базовые навыки Linux и работы с CLI, GPU/CPU настройка.
-
Требования — Подход и Soft skills•Исследовательский подход: постановка гипотез, A/B‑тесты, строгая оценка качестваретривера и генератора.•Итеративность: идти маленькими шагами с измеримыми улучшениями, а не«большой перезапуск обучения».•Фокус на данных: качество корпуса и поиска — первично, размер модели —вторичен.•Целеполагание: «Зачем мы это делаем?» — перед каждым этапом дообучения
Условия:
-
Формат работы: удалённо / гибридно (по договорённости).•График: гибкий, ориентирован на результат.•Компенсация: конкурентная, обсуждается с успешными кандидатами.•Тестовое задание: мини‑прототип на небольшом датасете (1–2 учебника) + короткийотчёт по метрикам. (с возмещением затрат на облачные вычислительные мощности)•Процесс: скрининг → техническое интервью → тестовое → финальное интервью →оффер