Команда занимается исследованиями и разработками (R&D) в области речевых технологий. Мы создали один из лучших в России классических синтезаторов речи и сейчас сосредоточены на исследовании больших языковых моделей (LLM) с речевыми интерфейсами. Наши ключевые направления включают разработку full-duplex моделей (модели, ведущей диалог голосом в режиме реального времени, непрерывно слушая себя и собеседника), моделей синхронного перевода, создание говорящих LLM, управляемых текстовыми инструкциями, а также, развитие масштабного пайплайна сбора данных.
Обязанности
- развивать архитектуры диалоговых модели full-duplex (одновременный прием аудио и генерация ответов) (память, внутренний монолог, добавление модальностей и тд)
- исследовать и применять методы обучения с подкреплением для повышения естественности качества устного диалога
- участвовать в развитии архитектуры и инфраструктуры модели в рамках исследовательского проекта
- обогащать данные и создавать новые алгоритмы и/или дизайн заданий по сбору/генерации данных.
Требования
- уверенные знания Python и алгоритмов глубокого обучения
- опыт работы с фреймворками распределённого обучения
- опыт работы с большими языковыми моделями (LLM): pretrain, SFT, alignment
- знание и понимание методов RL: PPO, DPO, DRPO или GRPO
Будет плюсом:
⦁ знания современных речевых технологий, методов токенизации аудио
⦁ опыт работы с аудио. Классическая цифровая обработка сигнала. Является плюсом, но не обязателен (готовность к самостоятельному изучению)
Условия
- возможность выбрать удобный график – гибрид или удаленка (локация: м. Кутузовская)
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека для сотрудников выгоднее до 4%
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.