Мы - команда GigaChat Data, готовим данные для обучения базовых моделей GigaChat во всех модальностях (Text, Vision, Audio): SFT, RLHF, использование навыков, безопасность модели и пр. Кроме подготовки базовой модели, мы реализуем продуктовые решения на основе базовой модели.
Одно из важнейших направлений нашей команды - обучение LLM GigaChat точным наукам, юриспруденции, медицине. Сотни профессиональных исследователей готовят обучающие данные (чистят, структурируют и пишут «с нуля»), ML-специалисты обучают модели. Мы работаем с лучшими университетами страны. Чтобы процессы были максимально эффективными, на всех этапах подготовки модели нам требуется четкая координация.
Обязанности
- организовывать и управлять процессами по разметке данных внутри команды GigaChat Data, совершенствовать существующие пайплайны
- налаживать эффективные коммуникации между различными командами (data аналитики, менеджеры разметки и другие)
- создавать инструменты по онбордингу и обучению разметчиков и AI-тренеров
- контролировать качество данных и их доступность для всех участников процесса
- строить и автоматизировать отчетность на основе данных (аналитика для доработки мониторингов и других инструментов контроля разметки данных, дашборды с метриками качества разметки, статистики по разметчикам/проектам и др).
Требования
- базовые знания Python, уверенная работа с Pandas и опыт работы с Jupyter для анализа и визуализации данных
- опыт выстраивания процессов управления данными и координации работы различных команд
- хорошие коммуникативные навыки, способность эффективно взаимодействовать с разными отделами
- понимание процессов работы с большими объемами данных и опыт работы с инструментами анализа данных
- способность решать проблемы и организовывать работу в условиях многозадачности
- понимание принципов работы LLM, этапов обучения моделей и базовых статистических метрик, используемых в ML
Будет плюсом:
- знание SQL, опыт работы с базами данных
- работа с платформами по разметке данных (TagMe, Toloka, Яндекс.Задания и т.п.)
Условия
- комфортный современный офис - м. Кутузовская
- ежегодный пересмотр зарплаты, годовой бонус
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера
- корпоративная пенсионная программа.