Мы ищем сильного Deep Learning инженера для развития и вывода на принципиально новый уровень GigaAM — лучшей open-source модели для распознавания речи на русском языке.
GigaAM — это не только исследовательский проект, но и core-модель, которая определяет качество работы многих ключевых продуктов экосистемы: GigaChat Audio, ASR, TTS, GigaChat Video и других.
Сейчас мы стоим перед масштабным вызовом: кратное увеличение параметров модели, масштабирование данных на несколько порядков, расширение языкового покрытия и выход за рамки распознавания речи в сторону general audio understanding. Если вы хотите создавать state-of-the-art решения, которыми будут пользоваться миллионы, и вносить вклад в развитие мирового open-source — нам по пути!
Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!
Обязанности
- Масштабирование данных: увеличение объемов данных для обучения на несколько порядков, построение эффективных пайплайнов их фильтрации и подготовки.
- Развитие архитектуры и метода предобучения: улучшение мультиязычных свойств модели и расширение ее возможностей в сторону анализа аудио неречевой природы.
- Scaling laws: масштабирование модели по количеству параметров в несколько раз.
- Research & Engineering: стабилизация процессов предобучения, проведение ML-экспериментов, проверка гипотез и доведение результатов до прода и публикаций.
Требования
уверенное владение Python и PyTorch
Distributed Training: практический опыт распределенного обучения, понимание ограничений и принципов работы под капотом (DDP, FSDP, ZeRO).
Опыт оптимизации DL-пайплайнов: профилирование и оптимизация узких инфраструктурных мест в процессе обучения (I/O bottlenecks, memory management, GPU utilization).
Экспертиза в Speech/Audio: понимание современных подходов и state-of-the-art архитектур в Speech/Audio Self-Supervised Learning.
Условия
- крупнейшее DS&AI community — более 600 DS-специалистов банка
- дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
- возможность быть соавтором НИРов и статей для международных конференций
- возможность выбрать удобный формат работы: гибрид или офис
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека выгоднее до 7% для каждого сотрудника
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.