Москва
Команда SaluteSpeech разрабатывает речевые технологии для Сбера. Наши модели работают в умных колонках, в колл-центрах, телефонных роботах и мобильных приложениях.
В этом году мы выложили в открытый доступ сразу несколько SOTA моделей распознавания речи и эмоций – GigaAM, а также развиваем мультимодальные LLM.
Один из наших проектов – GigaChat Audio. Мы выводим речевые технологии на новый уровень за счет использования современных моделей с огромным количеством параметров и строим диалоговую систему нового поколения, которая позволит пользователям взаимодействовать с голосом как с реальным человеком.
Обязанности
- проводить эксперименты по обучению LLM с аудио модальностью
- обучать аудио энкодеры
- оптимизировать код обучения больших моделей
- собирать демо для разных способов взаимодействия с Audio LLM.
Требования
- знание современных подходами для решения задач NLP
- глубокое понимание Deep Learning и архитектуры Transformer
- опыт в методах эффективного DL: распределенное обучение, data/model/tensor parallelism
- понимание этапов обучения LLM и опыт Parameter-Efficient Fine-tuning
- знание базовых алгоритмов и структуры данных
- опыт написания качественного и оптимального кода на Python.
Условия
- комфортный современный офис рядом с м. Кутузовская
- гибридный формат работы
- годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека для сотрудников выгоднее до 4%
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.