з/п не указана
Москва
От 3 до 6 лет
Наша команда в управлении экспериментальных систем машинного обучения работает над созданием моделей Computer Operator (задачи управления компьютерами, телефонами, браузерами и т.п.). Мы прицельно улучшаем работу моделей в этих задачах, используя передовые методы обучения (такие как online RL в средах), а успешные результаты приземляем в продукты.
Мы ищем AI Engineer, который займется подготовкой и проведением экспериментов с моделями.
Обязанности
- подготовить сетап эксперимента по обучению новым RL-методом (выбрать данные и сформулировать гипотезу, подготовить трейнер/награды и т.д.)
- построить процесс rejection sampling и стратификации данных для получения оптимальной сложности обучающих сэмплов на каждой стадии обучения
- провести серию экспериментов по добавлению данных из других доменов, определить их влияние на качество работы модели в целевых задачах
- подготовить новый online-бенчмарк для замеров наших моделей.
Требования
- хорошие знания в python 3.11, базовых структурах данных и алгоритмах
- умение писать эффективный код и отлаживать его современными инструментами, поддерживать порядок в проекте
- 2+ года опыта работы с обучением NLP моделей, отличное знание базы по Deep Learning, опыт в Supervised Fine-Tuning моделей
- библиотеки PyTorch, Transformers, vLLM, опыт обучения моделей на кластерах GPU
- git, опыт работы с Pull/Merge Requests, опыт работы с s3-like хранилищами.
Условия
- комфортный современный офис - м. Кутузовская
- ежегодный пересмотр зарплаты, годовой бонус
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера
- корпоративная пенсионная программа.