Старший инженер машинного обучения в Core LLM

Дата размещения вакансии: 15.05.2025
Работодатель: WILDBERRIES
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
Более 6 лет

Wildberries – это крупнейший маркетплейс России с миллионами пользователей и миллиардами оборота, работающий на рынке 19 лет. Наша компания стабильно развивается и работает в усиленном режиме: использует современный стек и новейшие технологии, разрабатывает множество новых hi-tech продуктов.

Сейчас мы ищем Senior Data Scientists в команду Core LLM. Основная задача - приносить пользу различным продуктам внутри WB, благодаря построению переиспользуемых решений. В моменте фокусируемся на карточках товаров и работаем в связке с командами Рекомендаций, Антифрода и Поиска.

Что нужно делать

  • Заниматься тюнингом LLM под русский язык и задачи WB;
  • Исследовать различные архитектуры нейронных сетей и их применимость к решению задач маркетплейса;
  • Доучивать LLM для автоматизации тех.поддержки;
  • Создавать векторные представления товаров и пользователей для персонализации рекомендаций, поиска, рекламы;
  • Решать задачи машинного перевода;
  • Решать задачи с использованием самых актуальных технологий и достижений в машинном обучении, читать и имплементировать наработки из научных статей.

Какой опыт и знания нужны

  • Опыт работы с LLM, дообучением GPT-like моделей;
  • Знание PyTorch, Numpy, Sklearn, transformers;
  • Опыт классической ML разработки одной или нескольких типов моделей: Text classification, NER, QA, machine translation;
  • Умение ориентироваться в алгоритмах и структурах данных;
  • Опыт построения систем с использованием RAG (Retrieval-Augmented Generation) подхода.

Мы предлагаем

  • Интересные задачи, и исследовательские, и прикладные, возможность переключаться между ними и видеть улучшения от них в production;
  • Большие данные, сотни миллионов товаров, миллиарды действий пользователей в день, ресурсы и инфраструктуру, необходимые для работы с ними;
  • Инфраструктура: Мощные GPU-кластеры, петабайты данных;
  • Развитие: Конференции, курсы, внутренние митапы;
  • Гибридный или удаленный формат работы с гибким началом рабочего дня;
  • Бесплатное питание в наших офисах;
  • Скидки на фитнес и образовательные программы.