з/п не указана
Москва
От 3 до 6 лет
Мы ищем руководителя направления обучения больших языковых моделей, который будет отвечать за развитие качества моделей в доменной области через системное управление обучением, данными и оценкой.
Роль предполагает работу на стыке исследований, инженерии и продуктовых задач с фокусом на практическое применение моделей в бизнесе.
Обязанности
1. Развитие качества моделей
- анализ современных методов обучения LLM (SFT, RLHF/DPO, synthetic data, дистилляция)
- формирование стратегии обучения моделей под бизнес-задачи
- определение необходимых навыков модели (skills decomposition)
2. Работа с данными
- проектирование и развитие пайплайна датасетов:
- сбор, очистка, разметка, валидация
- создание обучающих и тестовых выборок
- разработка синтетических датасетов
3. Бенчмарки и оценка
- разработка и поддержка системы оценки качества моделей
- создание бенчмарков (включая domain-specific)
- проведение регулярного тестирования и сравнительного анализа моделей
- контроль регресса
4. Управление командой
- руководство командой разметки (до 40 человек) и подготовки данных (4 человека)
- постановка задач, контроль качества разметки
- разработка методологии разметки и инструкций
- работа с инструментами разметки (например, TagMe)
5. Взаимодействие с рисками и compliance
- согласование подходов к обучению с управлением модельных рисков
- контроль аспектов: галлюцинации, bias, соответствие нормативным требованиям
- обеспечение прозрачности и воспроизводимости обучения
6. Интеграция с продуктом
- работа с продуктовыми командами (LLM-агенты, RAG-системы)
- приоритизация задач обучения на основе бизнес-метрик
- участие в запуске моделей в прод
7. Экономика и эффективность
- оценка эффективности обучения (качество vs стоимость)
- выбор оптимальных стратегий: дообучение vs архитектурные изменения
- оптимизация использования вычислительных ресурсов
Требования
- опыт работы с LLM / NLP от 3–5 лет
- практический опыт обучения моделей (SFT, RLHF/DPO или аналоги)
- опыт построения датасетов и evaluation pipelines
- понимание архитектуры LLM и принципов их обучения
- опыт управления командой
- уверенное владение Python и ML-стеком (PyTorch / HuggingFace)
Будет плюсом:
- опыт работы с доменными моделями (например, legal, finance)
- опыт построения пайплайнов генерации синтетических данных
- опыт внедрения моделей в прод
- знание подходов к снижению галлюцинаций.
Условия
- комфортный современный офис на ул. Вавилова д. 19
- формат работы - фул офис
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.