Senior Machine Learning Engineer (LLM, RL)

Дата размещения вакансии: 19.11.2025
Работодатель: Intella
Уровень зарплаты:
з/п не указана
Город:
Москва
Кольцевая линия метро Павелецкая
Требуемый опыт работы:
От 3 до 6 лет

Мы – Intella, крупнейшее узкопрофильное кадровое агентство на территории СНГ.

Сейчас мы ищем амбициозных кандидатов на роль Senior Machine Learning Engineer для международной компании, специализирующейся на разработке бизнес-решений с применением искусственного интеллекта. Организация работает над проектами, которые напрямую влияют на развитие фармацевтики и медицины. Команда мультиязычная, офисы разработки расположены в нескольких странах, включая Абу-Даби (ОАЭ). В компании работает более 300 сотрудников, а проекты реализуются на глобальном уровне.

Задачи:

  • Разработка и масштабирование тонкой настройки обучения с подкреплением для LLM, включая подходы RLHF, RLVR и другие современные методы

  • Построение и оптимизация высокопроизводительных конвейеров обучения трансформеров в средах с несколькими GPU и несколькими узлами.

  • Разработка экспериментов, мониторинг ключевых метрик и представление результатов в виде презентаций и/или публикаций.

  • Масштабирование пайплайнов и параллелизация обучения

Ожидания от кандидата:

  • ​​​​​​​​​​​​​​Коммерческий опыт тренировки и масштабирования LLM моделей: pre-train, fine-tune, обучение на нескольких GPU
  • Коммерческий опыт с RL ( RLHF / RLVR ), знание алгоритмов и методов preference-based optimization (PPO / DPO / RLOO / GRPO),
  • Навыки масштабирования пайплайнов, параллелизации обучения (DeepSpeed, vLLM)
  • Глубокие знания Python, PyTorch, Transformers / Diffusion models
  • Английский уровня B2+ для общения с командой
  • Высшее образование

Будет плюсом бэкграунд генеративными моделями/ разработкой LLM для написания кода / построением ревордных моделей / диффузионными моделями для молекул

​​​​​​​​​​​​​​Мы предлагаем:

  • Участие в социально-значимом медицинском проекте
  • Релокацию в Абу-Даби, ОАЭ. Возможна удаленная работа на период прохождения испытательного срока
  • Медицинскую страховку
  • Гибкий график работы