Senior Deep Learning Engineer (Speech / Audio Foundation Models)

Дата размещения вакансии: 15.04.2026
Работодатель: СБЕР
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Мы ищем сильного Deep Learning инженера для развития и вывода на принципиально новый уровень GigaAM — лучшей open-source модели для распознавания речи на русском языке.

GigaAM — это не только исследовательский проект, но и core-модель, которая определяет качество работы многих ключевых продуктов экосистемы: GigaChat Audio, ASR, TTS, GigaChat Video и других.

Сейчас мы стоим перед масштабным вызовом: кратное увеличение параметров модели, масштабирование данных на несколько порядков, расширение языкового покрытия и выход за рамки распознавания речи в сторону general audio understanding. Если вы хотите создавать state-of-the-art решения, которыми будут пользоваться миллионы, и вносить вклад в развитие мирового open-source — нам по пути!

Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!

Обязанности

  • Масштабирование данных: увеличение объемов данных для обучения на несколько порядков, построение эффективных пайплайнов их фильтрации и подготовки.
  • Развитие архитектуры и метода предобучения: улучшение мультиязычных свойств модели и расширение ее возможностей в сторону анализа аудио неречевой природы.
  • Scaling laws: масштабирование модели по количеству параметров в несколько раз.
  • Research & Engineering: стабилизация процессов предобучения, проведение ML-экспериментов, проверка гипотез и доведение результатов до прода и публикаций.

Требования

уверенное владение Python и PyTorch

Distributed Training: практический опыт распределенного обучения, понимание ограничений и принципов работы под капотом (DDP, FSDP, ZeRO).

Опыт оптимизации DL-пайплайнов: профилирование и оптимизация узких инфраструктурных мест в процессе обучения (I/O bottlenecks, memory management, GPU utilization).

Экспертиза в Speech/Audio: понимание современных подходов и state-of-the-art архитектур в Speech/Audio Self-Supervised Learning.

Условия

  • крупнейшее DS&AI community — более 600 DS-специалистов банка
  • дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
  • возможность быть соавтором НИРов и статей для международных конференций
  • возможность выбрать удобный формат работы: гибрид или офис
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека выгоднее до 7% для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.