Senior Deep Learning Engineer (Speech / Audio Foundation Models)

Дата размещения вакансии: 15.05.2026

Работодатель: СБЕР

Уровень зарплаты:

з/п не указана

Город:

Москва

Требуемый опыт работы:

От 3 до 6 лет

Мы ищем сильного Deep Learning инженера для развития и вывода на принципиально новый уровень GigaAM — лучшей open-source модели для распознавания речи на русском языке.

GigaAM — это не только исследовательский проект, но и core-модель, которая определяет качество работы многих ключевых продуктов экосистемы: GigaChat Audio, ASR, TTS, GigaChat Video и других.

Сейчас мы стоим перед масштабным вызовом: кратное увеличение параметров модели, масштабирование данных на несколько порядков, расширение языкового покрытия и выход за рамки распознавания речи в сторону general audio understanding. Если вы хотите создавать state-of-the-art решения, которыми будут пользоваться миллионы, и вносить вклад в развитие мирового open-source — нам по пути!

Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!

Обязанности

Масштабирование данных: увеличение объемов данных для обучения на несколько порядков, построение эффективных пайплайнов их фильтрации и подготовки.
Развитие архитектуры и метода предобучения: улучшение мультиязычных свойств модели и расширение ее возможностей в сторону анализа аудио неречевой природы.
Scaling laws: масштабирование модели по количеству параметров в несколько раз.
Research & Engineering: стабилизация процессов предобучения, проведение ML-экспериментов, проверка гипотез и доведение результатов до прода и публикаций.

Требования

уверенное владение Python и PyTorch

Distributed Training: практический опыт распределенного обучения, понимание ограничений и принципов работы под капотом (DDP, FSDP, ZeRO).

Опыт оптимизации DL-пайплайнов: профилирование и оптимизация узких инфраструктурных мест в процессе обучения (I/O bottlenecks, memory management, GPU utilization).

Экспертиза в Speech/Audio: понимание современных подходов и state-of-the-art архитектур в Speech/Audio Self-Supervised Learning.

Условия

крупнейшее DS&AI community — более 600 DS-специалистов банка
дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
возможность быть соавтором НИРов и статей для международных конференций
возможность выбрать удобный формат работы: гибрид или офис
ежегодный пересмотр зарплаты, годовая премия
корпоративный спортзал и зоны отдыха
более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
ипотека выгоднее до 7% для каждого сотрудника
бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
вознаграждение за рекомендацию друзей в команду Сбера.

Откликнуться

Senior Deep Learning Engineer (Speech / Audio Foundation Models)

Обязанности

Требования

Условия

Похожие вакансии: Москва