Ищем исследователей в команду NLP Core RnD в направление PLP.
Наша команда занимается обучением SOTA моделей для решения задач NLP и PLP.
Мы авторы многих моделей для русского языка (ruBert, ruRoberta, ruT5, ruGPT3, FRED-T5).
В PLP (Programming Language Processing) мы делаем модели и силами команды SberWorks внедряем их в продукты для разработчиков. Это новое и очень перспективное направление в ИИ. Делаем плагины для сред разработки. Разработали плагин автозавершения кода для VSCode, PyCharm, IDEA. В Сбере уже более 6000 строк кода в день пишут наши модели. Мы целимся превзойти результаты Copilot, TabNine. Занимаемся исследованиями различных подходов в PLP и разработкой новых моделей.
Если вы имеете амбиции добиться результатов в PLP и имеете много идей, что нового попробовать в этой области, то давайте к нам!
Обязанности
- формулирование гипотез исследований
- проведение экспериментов по обучению моделей на суперкомпьютере (кластре с гпу)
- претрейн новых моделей PLP с нуля
- валидация моделей
- прототипирование работы моделей.
Требования
- хорошие теоретические знания в DL
- знание последних достижений в области NLP/PLP, постоянно следите за последними пейперами
- умение формулировать эксперименты с научной строгостью обосновывать их и проводить самостоятельно
- опыт тюна моделей на различные задачи NLP/PLP
- опыт обучения трансформеров с нуля
- распределенное обучения моделей (horovod, torch.distibuted)
- стандартные библиотеки для DL и NLP (PyTorch, TensorFlow, Transformers)
- увлеченность NLP/PLP и DL.
Условия
- оформление по ТК РФ
- возможность работать удалённо или в офисе
- социальный пакет (ДМС)
- возможность посещения конференций, обучения и сертификации за счет компании
- офис: Москва, Кутузовский 32
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ.