Москва
Наша команда готовит данные для обучения LLM GigaSalute - это версия GigaChat-а для интеллектуального ассистента Салют. Салют работает на всех умных устройствах от SberDevices, а также на других поверхностях (Сбербанк Онлайн, 2GIS и другие) и обрабатывает десятки миллионов запросов пользователей в день.
Наши задачи: подготовка данных для всех этапов обучения GigaSalute, создание и внедрение метрики оценки качества работы GigaSalute, организация разметки для GigaSalute, инициирование различных экспериментов для обучения базовой модели, обучение модели для обработки данных.
Обязанности
- писать пайплайны анализа моделей перед отправкой в продакшн, пайплайны сбора тренировочных данных и пайплайны сбора разметки
- анализировать модели
- придумывать и внедрять метрики оценки качества работы GigaSalute
- инициировать различные эксперименты для обучения базовой модели
- доработка функционала для работы со смежниками
Требования
- знание Python на высоком уровне (алгоритмы, структуры данных, GIL, async - Pandas в разработке не используем);
- аналогичный опыт работы от 3 лет
- знание продуктовых и ML метрик
- знание и опыт применения математической статистики, теории вероятности.
Будет плюсом:
- опыт подготовки данных для больших моделей.
Условия
- комфортный современный офис рядом с м. Кутузовская
- гибридный формат работы(офис 1 день в неделю)
- оклад по результатам прохождения технического интервью
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека для сотрудников выгоднее до 4%
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.