Data Scientist в команду LLM Train

Дата размещения вакансии: 07.04.2026
Работодатель: HeadHunter
Уровень зарплаты:
з/п не указана
Город:
Москва
2-я Брестская улица 48
Требуемый опыт работы:
От 3 до 6 лет

Мы активно развиваем GenAI-направление в hh.ru. Уже сейчас в разных командах используются LLM-модели для генерации текстов, ведения диалогов, классификации и анализа вакансий и резюме. Направление является для нас стратегическим, поэтому сейчас мы ищем технического лидера, который поможет выстроить в компании системный подход к обучению и адаптации LLM-моделей под задачи HR-домена.

Если вам интересно закладывать основу для устойчивого использования GenAI в продуктах — через LLM-модели, датасеты, метрики, процессы, которыми будут пользоваться десятки команд, и вы смотрите на ML не просто как на технологию, а как на инструмент влияния на продукт — мы будем рады видеть вас в нашей команде.

Обязанности:

  • Файнтюнинг Open Source LLM-моделей для решения HR-задач (генерация описания вакансий, общение с клиентами, анализ резюме, модерация и т.п.).
  • Исследование и внедрение современных архитектур, а также подходов к обучению моделей.
  • Создание и поддержка специализированных датасетов для адаптации моделей под HR-домен.
  • Оптимизация моделей для production-среды (квантизация, дистилляция).
  • Тесное взаимодействие с продуктовыми командами, командами оценки качества и MLOps для интеграции моделей в продукты и сервисы hh.
  • Разработка стандартов и процессов обучения моделей и помощь другим командам в их внедрении.

Требования:

  • Глубокое понимание современных архитектур и методов обучения языковых моделей.
  • Практический опыт файнтюнинга различных LLM под продуктовые задачи (SFT, PEFT, RLHF, LoRA, PPO, DPO, GRPO).
  • Уверенное владение Python и экосистемой ML и LLM-инструментов (PyTorch, TRL, Accelerate, PEFT, Transformers, VLLM, etc).
  • Живой интерес к сфере GenAI, опыт работы с популярными вендорными и open-source моделями (Qwen, Llama, DeepSeek, GPT-OSS).
  • Практический опыт создания решений на базе LLM (prompt engineering, RAG, function calling, structured outputs, reasoning, agents).
  • Понимание методов оценки качества LLM (бенчмарки, human eval, LLM-as-as-Judge) и метрик для различных NLP-задач.
  • Умение балансировать исследовательские задачи и бизнес-требования.

Будет плюсом

  • Опыт распределенного обучения LLM на GPU-кластерах.
  • Опыт внедрения LLM-решений в продакшн.

Условия:

  • Возможность выбора места работы: удаленно или из офиса.
  • Гибкий график рабочего дня.
  • Оформление в соответствии с ТК РФ, «белая» заработная плата, выплачиваемая точно в срок.
  • Корпоративное ДМС с первого месяца работы (решаем вопросы со здоровьем быстро и удобно).
  • Возможность профессионального развития, обучение за счет компании, участие в специализированных конференциях.