Москва
Мы - команда профессионалов, работающих над созданием сервиса машинного перевода "Толмач". Мы стремимся к постоянному развитию и улучшению нашего продукта, поэтому ищем талантливого MLE, который поможет нам расширить возможности "Толмача".
Обязанности
- Исследование и внедрение перспективных методов оптимизации пайплайнов на инференсе.
- Поиск и устранение проблемных мест в пайплайнах моделей на инференсе.
- Оптимизация существующих пайплайнов под различные вычислительные платформы.
- Разработка бэкенда для интеграции моделей в продукт.
Требования
- Знание языков программирования: Python
- Знание фреймворков, платформ и технологий: PyTorch, ONNX, Triton, REST
- Понимание особенностей обучения моделей на основе архитектуры трансформеров
- Глубокие знания о работе transformer-like моделей
- Навыки оптимизации пайплайнов обучения и инференса
- Опыт разработки инференса каскада моделей
- Системный подход к решению задач
- Английский язык на уровне чтения научных статей
Будет плюсом:
- Опыт разработки звуковых моделей (TTS, ASR) и моделей машинного перевода
- Понимание различий между R&D и продуктом и умение применять эти знания в работе.
- Знание C++
Условия
- Работу в дружной и профессиональной команде.
- Возможность влиять на развитие молодого быстроразвивающегося продукта.
- Конкурентоспособную заработную плату.
- Гибкий график работы. (Возможность гибрида обсуждается отдельно)
- Участие в конференциях и семинарах по машинному обучению.
- Если вы готовы присоединиться к нашей команде и внести свой вклад в развитие "Толмача"