AI Engineer – RAG / Knowledge Graph / Local LLM

Дата размещения вакансии: 01.06.2026
Работодатель: ГЛАВКАФЕ.
Уровень зарплаты:
от 180000 до 250000 RUR
Город:
Москва
Западный административный округ, Можайский район, Инновационный центр Сколково, Большой бульвар 42с1
Требуемый опыт работы:
От 3 до 6 лет

О нас

LumosIT - пять лет на рынке IT-разработки для бизнеса, резидент Технопарка Сколково, резидент Московского Инновационного Кластера, патенты на изобретения в области передовых методов AI.

Строим корпоративные AI-системы для B2B: от строительства и производства до банков и логистики. Ядро нового продукта - интеллектуальные базы знаний, которые отвечают на основе внутренней документации компании без галлюцинаций и с трассировкой до источника. Заказов становится больше, проекты идут параллельно, поэтому расширяем команду инженером, для которого RAG это основная специализация.

Чем предстоит заниматься

  • Проектировать и строить RAG-пайплайны под нестандартные источники: транскрипты, живая речь, методологические материалы

  • Строить Knowledge Graph поверх векторной базы - типология связей, смысловые цепочки, интеграция с retrieval в лучших традициях Карпати

  • Разворачивать LLM семейства Qwen локально, настраивать OpenAI-совместимый API поверх

  • Работать с Qdrant: payload-фильтрация, гибридный поиск, мультиарендная архитектура

Задачи повторяются от проекта к проекту, устойчивый поток работы.

Требования

Опыт в Python и ML от 5-6 лет. С RAG-системами от 2-3 лет - с того момента, когда это стало актуальной инженерной задачей.

  • Гибридный поиск (dense + sparse/BM25) - строил, понимаешь ограничения семантики

  • Qdrant или аналог (Weaviate, Milvus) - работал в продакшне, не на пет-проектах

  • Knowledge Graph - ребра с типологией, граф-обход, связка с векторным поиском

  • Локальный деплой: llama.cpp, vLLM или Ollama, квантизация, CUDA

  • LangGraph или LangChain - многошаговые агенты с состоянием, обработка ошибок, retry

  • Русскоязычные данные - знаешь специфику токенизации, умеешь выбирать embedding-модель под задачу

Стек: Python 3.10+, FastAPI, asyncio · LangGraph · Qdrant + pgvector · PostgreSQL / SQLAlchemy async · sentence-transformers, multilingual-e5-large · NetworkX · llama.cpp / vLLM · Docker, Linux · Git

Плюсом: опыт с RAGAS / DeepEval, Neo4j, неструктурированными источниками, LoRA fine-tuning на RU-данных.

Условия

Работа удаленная. При желании - рабочее место в Технопарке Сколково.

Работа напрямую с основателем компании без лишних звеньев.

Договор с самозанятым или ИП. Оформление по ТК обсуждается.

Зарплата: 180 000 - 260 000 руб., финальная цифра по итогам разговора.

Вводный период 1-2 недели, оплачивается. Небольшое тестовое задание на 1-2 часа на этапе отбора.