NLP Engineer в Computer Operator (RnD)

Дата размещения вакансии: 08.05.2026

Работодатель: СБЕР

Уровень зарплаты:

з/п не указана

Город:

Москва

Требуемый опыт работы:

От 3 до 6 лет

Наша команда в управлении экспериментальных систем машинного обучения работает над созданием моделей Computer Operator (задачи управления компьютерами, телефонами, браузерами и т.п.). Мы прицельно улучшаем работу моделей в этих задачах, используя передовые методы обучения (такие как online RL в средах), а успешные результаты приземляем в продукты.

Мы ищем AI Engineer, который займется подготовкой и проведением экспериментов с моделями.

Обязанности

подготовить сетап эксперимента по обучению новым RL-методом (выбрать данные и сформулировать гипотезу, подготовить трейнер/награды и т.д.)
построить процесс rejection sampling и стратификации данных для получения оптимальной сложности обучающих сэмплов на каждой стадии обучения
провести серию экспериментов по добавлению данных из других доменов, определить их влияние на качество работы модели в целевых задачах
подготовить новый online-бенчмарк для замеров наших моделей.

Требования

хорошие знания в python 3.11, базовых структурах данных и алгоритмах
умение писать эффективный код и отлаживать его современными инструментами, поддерживать порядок в проекте
2+ года опыта работы с обучением NLP моделей, отличное знание базы по Deep Learning, опыт в Supervised Fine-Tuning моделей
библиотеки PyTorch, Transformers, vLLM, опыт обучения моделей на кластерах GPU
git, опыт работы с Pull/Merge Requests, опыт работы с s3-like хранилищами.

Условия

комфортный современный офис - м. Кутузовская
ежегодный пересмотр зарплаты, годовой бонус
корпоративный спортзал и зоны отдыха
более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
вознаграждение за рекомендацию друзей в команду Сбера
корпоративная пенсионная программа.

Откликнуться

NLP Engineer в Computer Operator (RnD)

Обязанности

Требования

Условия

Похожие вакансии: Москва