Senior ML/AI Engineer

Дата размещения вакансии: 05.03.2026
Работодатель: SDI Research
Уровень зарплаты:
з/п не указана
Город:
Москва
Пресненская набережная 8с1
Требуемый опыт работы:
От 3 до 6 лет

Российская IT-компания, разработчик тиражируемой интеллектуальной платформы по управлению данными. Основным продуктом компании является "Semantic MDM".

Чем предстоит заниматься:

  • Проектировать и внедрять NLP/LLM решения в продуктовые сценарии MDM: классификация, извлечение/нормализация атрибутов, дедупликация, поиск/вопрос-ответ по данным и документам;
  • Строить retrieval + RAG пайплайны: подготовка корпуса, индексация, ранжирование, промптинг, постобработка, guardrails;
  • Адаптировать и дообучать open-source LLM-модели под задачи (prompting, LoRA/QLoRA, PEFT-подходы), оптимизировать инференс (включая квантизацию — при необходимости);
  • Выстраивать оценку качества: датасеты, разметка, метрики, регрессионные тесты для retrieval/RAG и качества LLM-ответов;
  • Интегрировать ML/LLM-компоненты в продукт совместно с командами backend/frontend (API, контракты, требования к данным);
  • Участвовать в выборе технологического стека и принимать архитектурные решения по ML части;

Требования:

  • Глубокое знание Python и опыт production-разработки(структура проекта, тесты, версионирование моделей, логирование/трассировка);

  • Понимание архитектур трансформеров и опыт их применения для NLP-задач;

  • Практический опыт NLP/LLM в реальных задачах: работа с PyTorch и transformers, понимание fine-tuning/adaptation подходов (например, PEFT/LoRA) и ограничений LLM;

  • Опыт построения retrieval/RAG-компонентов: эмбеддинги, индекс, оценка качества retrieval;

  • Умение проектировать и защищать решения: формулировать гипотезы, проводить эксперименты, анализировать результаты;

  • Умение доводить модели до продакшена: сервисная интеграция, мониторинг качества/ошибок, работа с ограничениями latency/стоимости;

  • Навыки написания чистого, поддерживаемого кода;

  • Высшее образование;
  • Знание английского языка для чтения и анализа технической документации;

Приветствуется:

  • Опыт сбора, разметки данных, знание основных инструментов и умение ими пользоваться;
  • Опыт интеграции с LLM API (например, GigaChat, YandexGPT, DeepSeek или аналоги), работа со streaming-ответами;
  • LangChain/LlamaIndex, tool calling/function calling, оркестрация агентных сценариев;
  • Векторные/поисковые хранилища и движки: OpenSearch, pgvector, FAISS; опыт reranking;

Условия:

  • оформление по ТК РФ;
  • заработная плата определяется на собеседовании;
  • премии по результатам работы;
  • возможность профессионального роста и развития;
  • ДМС, оплачиваемый отпуск и больничные;
  • возможна удаленная работа/гибрид.