Senior Data Scientist (GigaCode)

Дата размещения вакансии: 24.11.2024
Работодатель: СБЕР
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Мы авторы многих моделей для русского языка (ruBert, ruRoberta, ruT5, ruGPT3, FRED-T5). Мы делаем модели и силами команды SberWorks внедряем их в продукты для разработчиков. Это новое и очень перспективное направление в ИИ. Делаем плагины для сред разработки. Разработали плагин автозавершения кода для VSCode, PyCharm, IDEA . В Сбере уже более 6000 строк кода в день пишут наши модели. Мы целимся превзойти результаты Copilot, TabNine. Занимаемся исследованиями различных подходов в PLP и разработкой новых моделей.

Если вы имеете амбиции добиться результатов в PLP и имеете много идей, что нового попробовать в этой области, то давайте к нам!

Обязанности:

  • Формулирование гипотез исследований;
  • Проведение экспериментов по обучению моделей на суперкомпьютере (кластре с гпу);
  • Претрейн новых моделей PLP с нуля;
  • Валидация моделей;
  • Прототипирование работы моделей.

Требования:

  • хорошие теоретические знания в DL;
  • знание последних достижений в области NLP/PLP. Постоянно следите за последними пейперами;
  • умение формулировать эксперименты с научной строгостью, обосновывать их и проводить самостоятельно;
  • опыт тюна моделей на различные задачи NLP/PLP;
  • опыт обучения трансформеров с нуля;
  • распределенное обучения моделей (horovod, torch.distibuted);
  • стандартные библиотеки для DL и NLP (PyTorch, TensorFlow, Transformers);
  • увлеченность NLP/PLP и DL;

Дополнительно плюсом будет:

  • участие в соревнованиях по ML;
  • сабмиты на лидербордах по NLP/PLP;
  • публикации;
  • обучение моделей на кластере;
  • оценка качества моделей;
  • оптимизация инференса моделей;

Условия:

  • оформление по ТК РФ;
  • возможность работать удалённо или в офисе;
  • социальный пакет (ДМС);
  • возможность посещения конференций, обучения и сертификации за счет компании;
  • офис: Москва, Кутузовский 32.