Senior Data Scientist (GigaCode)

Дата размещения вакансии: 24.11.2024

Работодатель: СБЕР

Уровень зарплаты:

з/п не указана

Город:

Москва

Требуемый опыт работы:

От 3 до 6 лет

Мы авторы многих моделей для русского языка (ruBert, ruRoberta, ruT5, ruGPT3, FRED-T5). Мы делаем модели и силами команды SberWorks внедряем их в продукты для разработчиков. Это новое и очень перспективное направление в ИИ. Делаем плагины для сред разработки. Разработали плагин автозавершения кода для VSCode, PyCharm, IDEA . В Сбере уже более 6000 строк кода в день пишут наши модели. Мы целимся превзойти результаты Copilot, TabNine. Занимаемся исследованиями различных подходов в PLP и разработкой новых моделей.

Если вы имеете амбиции добиться результатов в PLP и имеете много идей, что нового попробовать в этой области, то давайте к нам!

Обязанности:

Формулирование гипотез исследований;
Проведение экспериментов по обучению моделей на суперкомпьютере (кластре с гпу);
Претрейн новых моделей PLP с нуля;
Валидация моделей;
Прототипирование работы моделей.

Требования:

хорошие теоретические знания в DL;
знание последних достижений в области NLP/PLP. Постоянно следите за последними пейперами;
умение формулировать эксперименты с научной строгостью, обосновывать их и проводить самостоятельно;
опыт тюна моделей на различные задачи NLP/PLP;
опыт обучения трансформеров с нуля;
распределенное обучения моделей (horovod, torch.distibuted);
стандартные библиотеки для DL и NLP (PyTorch, TensorFlow, Transformers);
увлеченность NLP/PLP и DL;

Дополнительно плюсом будет:

участие в соревнованиях по ML;
сабмиты на лидербордах по NLP/PLP;
публикации;
обучение моделей на кластере;
оценка качества моделей;
оптимизация инференса моделей;

Условия:

оформление по ТК РФ;
возможность работать удалённо или в офисе;
социальный пакет (ДМС);
возможность посещения конференций, обучения и сертификации за счет компании;
офис: Москва, Кутузовский 32.

Откликнуться

Senior Data Scientist (GigaCode)

Похожие вакансии: Москва