LLM Engineer

Дата размещения вакансии: 19.02.2026

Работодатель: Интерфакс

Уровень зарплаты:

з/п не указана

Город:

Москва
Долгоруковская улица 7

Требуемый опыт работы:

От 3 до 6 лет

Информационная группа «Интерфакс» - компания с 30 – летней историей, лидер российского информационного рынка в сегменте В2В.

Кроме того, что мы информационное агентство #1 в России, мы еще и крупная IT-компания с несколькими центрами программных разработок, расположенными в Москве и регионах.

Мы разрабатываем ИТ решения, которые помогают компаниям работать на финансовом и товарном рынках, принимать инвестиционные решения, управлять рисками, организовывать внешние коммуникации.

Наши флагманские продукты - это такие системные решения, как
СПАРК, SCAN, МАРКЕР, X – Compliance и другие.

В данный момент вакансия LLM Engineer открыта в Новом Департаменте и создается направление в разработке ИИ агентов.

Описание проекта:

Мы создаем ИИ ассистента на базе LLM для нового продукта на рынке;
ИИ ассистент будет помогать нашим клиентам с анализом информации и выработки правильных управленческих решений, а в последующем и возьмет на себя функции автоматизации;
Одна из функции это обработка документов (PDF, сканов, DOCX и др.) для последующей работы с ними в рамках сценариев ИИ ассистента – получение ответов по содержанию текстов, выделение ключевых обстоятельств, суммаризация и так далее.

Роль:

Нужен инженер, который спроектирует и реализует сервис на базе NLP & RAG: от ingestion сырых документов до готовых индексов и фичей для LLM‑ассистента;
Разработка сервисов обработки PDF и других форматов документов, нормализации , поиска, извлечения атрибутов и сущностей.

Основные задачи:

Проектирование и разработка пайплайна обработки документов: загрузка сырых PDF/сканов, конвертация (OCR), извлечение текста и метаданных, очистка и нормализация;
Разметка и структурирование документов: выделение реквизитов, дат, номеров и других атрибутов и сущностей;
Построение offline и online обработки, в т.ч. RAG‑архитектуры: разбиение документов на чанки, генерация эмбеддингов, построение векторных индексов, настройка поиска, тематическая саммаризация.

Требования к кандидату:

Опыт промышленной разработки на Python от 4–6 лет;
Уверенный опыт разработки backend‑сервисов, в т.ч. на FastAPI;
Опыт реализации пайплайнов обработки текстовых документов (желательно — юридических, финансовых или комплаенс);
Понимание и практический опыт построения RAG‑систем: векторный и гибридный поиск, индексация, работа с эмбеддингами, кастомизация и дообучение BERT;
Опыт работы с LangChain/LangGraph или аналогичными фреймворками, а также разработка оркестрации LLM‑агентов;
Опыт работы с векторными БД: Milvus, Qdrant, pgvector, Faiss;
Опыт интеграции с LLM API (OpenAI, Anthropic, локальные модели и пр.), глубокое понимание prompt‑инженеринга;
Опыт разработки и интеграции RESTful API, знание Docker, CI/CD, понимание требований к безопасности и масштабируемости в enterprise‑среде.

Будет плюсом:

Опыт работы с популярными ML-фреймворками: TensorFlow, PyTorch, Scikit-learn, XGBoost и т.д.;
Опыт настройки OCR и извлечения текста из «грязных» PDF и сканов (Tesseract, Azure/AWS/GCP Vision и т.п.);
Понимание MLOps‑подходов и опыта деплоя self‑hosted LLM (Llama, Mistral и др.);
Опыт использования и дообучения современных NLP‑моделей под задачи NER, классификации документов, извлечения сущностей.

Мы предлагаем:

Официальное оформление по ТКРФ;
Расширенное ДМС со стоматологией/ корпоративные скидки;
Офис в историческом центре Москвы (Маяковская, 1 мин. ходьбы от метро);
Гибридный график работы;
Возможности профессионального роста и развития;
Участие в интересных проектах с использованием современных технологий;
Дружелюбную атмосферу и поддержку коллег.
Если вы страстны к разработке, любите разбираться в сложных системах и хотите стать частью инновационной команды — присылайте свое резюме!

Откликнуться

LLM Engineer

Похожие вакансии: Москва