Находимся в поиске Data Scientist (Speech)
Мы – РТК ИТ, аккредитованная ИТ компания, оказывающая полный комплекс услуг по разработке и внедрению программных решений.
Каждый день на наших проектах задействовано 4200+ сотрудников, у нас 70+ направлений разработки различных решений. За 11 лет нашей работы мы успешно реализовали более 60 ИТ-продуктов.
"Вам предстоит:
Разработка и запуск ASR-сервиса:
- Русское распознавание;
- Выстраивание процесса разметки и оценивания;
- Адаптация под доменную область;
- Streaming и offline формат работы;
- Развитие и повышение качества.
Разработка и запуск TTS-сервиса:
- Русские голоса;
- Оптимизация под работу в онлайн формате.
Сервис транскрибации и аналитики встреч:
- Диаризация, speaker-attribution, паралингвистика (эмоции, паузы);
- Совместная работа с NLP-командой над авто-саммари, action items, поиск по встречам.
Нам важны:
- Опыт от 1+ года в ASR, TTS или другом аудио-ML;
- Глубокое знание современных архитектур DL для речи (RNN/CTC, Transducer, Transformer/Conformer, VAE-GAN, diffusion);
- Умение писать промышленный код;
- Опыт деплоя и мониторинга высоконагруженных ML-сервисов (K8s \ OKD, Argo, Prometheus\Grafana).
Будет плюсом:
- Участие в соревнованиях по ML/DL;
- Понимание основных уязвимостей и проблем безопасности при работе с AI;
- Публикации на профильную тематику."