LLM Engineer

Дата размещения вакансии: 19.02.2026
Работодатель: Интерфакс
Уровень зарплаты:
з/п не указана
Город:
Москва
Долгоруковская улица 7
Требуемый опыт работы:
От 3 до 6 лет
Информационная группа «Интерфакс» - компания с 30 – летней историей, лидер российского информационного рынка в сегменте В2В.
Кроме того, что мы информационное агентство #1 в России, мы еще и крупная IT-компания с несколькими центрами программных разработок, расположенными в Москве и регионах.
Мы разрабатываем ИТ решения, которые помогают компаниям работать на финансовом и товарном рынках, принимать инвестиционные решения, управлять рисками, организовывать внешние коммуникации.
Наши флагманские продукты - это такие системные решения, как
СПАРК, SCAN, МАРКЕР, X – Compliance и другие.
В данный момент вакансия LLM Engineer открыта в Новом Департаменте и создается направление в разработке ИИ агентов.
Описание проекта:
  • Мы создаем ИИ ассистента на базе LLM для нового продукта на рынке;
  • ИИ ассистент будет помогать нашим клиентам с анализом информации и выработки правильных управленческих решений, а в последующем и возьмет на себя функции автоматизации;
  • Одна из функции это обработка документов (PDF, сканов, DOCX и др.) для последующей работы с ними в рамках сценариев ИИ ассистента – получение ответов по содержанию текстов, выделение ключевых обстоятельств, суммаризация и так далее.
Роль:
  • Нужен инженер, который спроектирует и реализует сервис на базе NLP & RAG: от ingestion сырых документов до готовых индексов и фичей для LLM‑ассистента;
  • Разработка сервисов обработки PDF и других форматов документов, нормализации , поиска, извлечения атрибутов и сущностей.
Основные задачи:
  • Проектирование и разработка пайплайна обработки документов: загрузка сырых PDF/сканов, конвертация (OCR), извлечение текста и метаданных, очистка и нормализация;
  • Разметка и структурирование документов: выделение реквизитов, дат, номеров и других атрибутов и сущностей;
  • Построение offline и online обработки, в т.ч. RAG‑архитектуры: разбиение документов на чанки, генерация эмбеддингов, построение векторных индексов, настройка поиска, тематическая саммаризация.
Требования к кандидату:
  • Опыт промышленной разработки на Python от 4–6 лет;
  • Уверенный опыт разработки backend‑сервисов, в т.ч. на FastAPI;
  • Опыт реализации пайплайнов обработки текстовых документов (желательно — юридических, финансовых или комплаенс);
  • Понимание и практический опыт построения RAG‑систем: векторный и гибридный поиск, индексация, работа с эмбеддингами, кастомизация и дообучение BERT;
  • Опыт работы с LangChain/LangGraph или аналогичными фреймворками, а также разработка оркестрации LLM‑агентов;
  • Опыт работы с векторными БД: Milvus, Qdrant, pgvector, Faiss​;
  • Опыт интеграции с LLM API (OpenAI, Anthropic, локальные модели и пр.), глубокое понимание prompt‑инженеринга;
  • Опыт разработки и интеграции RESTful API, знание Docker, CI/CD, понимание требований к безопасности и масштабируемости в enterprise‑среде.
Будет плюсом:
  • Опыт работы с популярными ML-фреймворками: TensorFlow, PyTorch, Scikit-learn, XGBoost и т.д.;
  • Опыт настройки OCR и извлечения текста из «грязных» PDF и сканов (Tesseract, Azure/AWS/GCP Vision и т.п.);
  • Понимание MLOps‑подходов и опыта деплоя self‑hosted LLM (Llama, Mistral и др.);
  • Опыт использования и дообучения современных NLP‑моделей под задачи NER, классификации документов, извлечения сущностей.
Мы предлагаем:
  • Официальное оформление по ТКРФ;
  • Расширенное ДМС со стоматологией/ корпоративные скидки;
  • Офис в историческом центре Москвы (Маяковская, 1 мин. ходьбы от метро);
  • Гибридный график работы;
  • Возможности профессионального роста и развития;
  • Участие в интересных проектах с использованием современных технологий;
  • Дружелюбную атмосферу и поддержку коллег.
  • Если вы страстны к разработке, любите разбираться в сложных системах и хотите стать частью инновационной команды — присылайте свое резюме!