Команда клиентского сервиса с использованием ML/DL создает инструменты для улучшения процессов взаимодействия с клиентами. В их числе средства анализа точек касания с клиентами и средства автоматизации внутренних процессов для пользы клиентов.
Для решения задач распознавания речи (ASR/TTS) ищем разработчика-исследователя, который усилит нашу команду в этом направлении.
⁃ Разрабатывать и внедрять модели распознания речи (ASR/STT);
⁃ Разрабатывать скрипты для создания датасетов и проведения бенчмарков моделей;
⁃ Формировать и тестировать гипотезы;
⁃ Заниматься профилированием моделей с использованием инструментов Nvidia и других.
МЫ ЖДЕМ, ЧТО ВЫ:
⁃ Имеете глубокие знания математики, алгоритмов, структур данных и статистики;
⁃ Программируете на Python, R или подобных языках, умеете писать чистый код;
⁃ Имеете экспертизу в технологиях ASR и последних достижениях в этой области;
⁃ Работали с Whisper HF и методами ускорения;
⁃ Умеете анализировать и оптимизировать алгоритмы пре- и пост-обработки аудио;
⁃ Занимались обучением моделей ASR и оптимизацией для GPU/CPU;
⁃ Имеете высшее образование в области математического моделирования/ информатики/ машинного обучения.
БУДЕТ ПЛЮСОМ, ЕСЛИ ВЫ:
⁃ Знаете принципы реализации биометрии по голосу, определения пола;
⁃ Имеете экспертизу в диаризации спикеров в моно-канале;
⁃ Решали задач NLP (кластеризация, классификация, LLM) и умеете упаковывать модели в REST-микросервис