Senior ML engineer, Large Language & Behavior Models (LLM)

Дата размещения вакансии: 24.06.2024
Работодатель: WILDBERRIES
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Мы ищем Senior ML-инженера в направление Large Language & Behavior Models для решения задач классификации и генерации текстов, связанных с работой маркетплейса, а также анализа и прогнозирования поведения пользователей.

На Wildberries продаётся примерно 160 млн. различных товаров. Каждый из них продавцы описывают. Иногда качественно, иногда не очень, порой пытаются использовать текстовое SEO. Нужно извлекать смысл из того, что они написали, и помогать им написать лучше.
А ещё каждый день покупатели делают около 11 млрд. действий. По последовательностям, с какими товарами и какие действия они выполняют, нужно узнавать их интересы, а также дополнительные свойства товаров.

Рекомендации товаров уже используют LLM (в сочетании с CV) и поведенческие модели, скоро будут использоваться в Поиске. Вам предстоит улучшать их качество, а также помогать другим ML-инженерам их применить:

  • как есть, в виде результатов классификации, регрессии, ранжирования, сгенерированных текстов, извлечённых сущностей, эмбеддингов;
  • достраивая части, нужные для решения конкретных задач в продукте;
  • дообучая на своих примерах и т.д.

Для этого нужно:

  • Вместе с продактами и аналитиками разбираться, какие проблемы и перспективы для улучшения есть во flow продавца, покупателя, работе сервисов и механизмов Wildberries;
  • Генерировать и проверять гипотезы, какие существующие и новые инструменты и pretrained модели можно в них применить, при необходимости подбирать данные/заказывать разметку, дообучать, если нужно учить заново, придумывать собственные улучшения и архитектуру (потребуется знать и уметь применять современные, state-of-the-art основные библиотеки, подходы, pretrained нейросети, архитектуры нейросетей, понимать подходы, закономерности, мат. статистику и алгоритмы, лежащие в их основе);
  • Разрабатывать классификаторы, архитектуры нейросетей, эмбеддинги текстов и поведения, которые будут улучшать качество поиска, рекомендаций по подходящим, похожим и сопутствующим товарам, рейтинга товаров, рекомендаций для продавцов и других частей продукта;
  • Измерять и проверять качество — offline-метриками, в CI/CD и автотестах, с помощью асессоров, online-метриками в экспериментах;
  • Вместе с бэкендерами строить из этого production pipeline обработки и сервисы (нужен опыт применения дискриминативных и генеративных LLM в высоко нагруженных системах), умение оптимизировать и ускорять inference модели в production является большим плюсом.


Мы предлагаем:

  • Интересные задачи, и исследовательские, и прикладные, возможность переключаться между ними и видеть улучшения от них в production;
  • Большие данные, сотни миллионов товаров, миллиарды действий пользователей в день, ресурсы и инфраструктуру, необходимые для работы с ними;
  • Гибридный формат работы: от офиса в Москве (с бесплатными завтраками, обедами и ужинами) до удаленки из любой точки мира, гибкое начало рабочего дня;
  • Вариативность оформления: трудовой договор, самозанятость, ИП или ГПХ;
  • ДМС после 3-х месяцев испытательного срока: телемедицина, очные приемы, ежегодный чек-ап для сотрудника, а также онлайн-консультации для родственников;
  • Корпоративные скидки у партнеров, внешние программы по обучению и внутренние митапы;
  • Ежегодную 40%-ую скидку на покупку ноутбука или мобильного телефона.