Senior NLP Engineer for Voice Assistant

Дата размещения вакансии: 26.04.2024
Работодатель: АТОМ
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Мы разрабатываем диалоговую систему, которая позволит водителям осуществлять покупки и заказывать товары во время вождения автомобиля с помощью разговора голосом с виртуальным ассистентом. В системе будут использованы передовые технологии распознавания и синтеза речи, понимания естественного языка на основе нейросетевых моделей типа BERT, RoBERTa, Electra, GPT, Transformer.

Основные задачи:

  • Разработка моделей интент классификации, извлечения сущностей, генерации ответов с использованием LLM.
  • Дообучение генеративных языковых моделей для задач диалога, суммаризации, QA.
  • Исследование и применение методов оптимизации LLM — Fine-tuning, RL-агенты, RLHF, LoRA, P-Tuning.
  • Разработка и тестирование диалоговых сценариев взаимодействия с пользователем.

От кандидата ожидается:

  • Понимание архитектур нейронных сетей, применяемых в LLM
  • Опыт разработки и внедрения моделей обработки естественного языка.
  • Практический опыт и знание подходов оптимизации и дообучения LLM.
  • Навыки production-grade разработки и тестирования ML систем.
  • Глубокое понимание методов ML/DL, опыт работы с PyTorch, Tensorflow, sklearn.
  • Умение писать качественный, поддерживаемый код.
  • Быстрая проверка гипотез на результат.
  • Умение чётко и ясно излагать свои мысли, как письменно, так и голосом при встречах, для понимания Вас всеми членами команды.
  • Знания английского языка (чтение технической литературы).

Будет плюсом:

  • Опыт работы с диалоговыми системами, оптимизацией генеративных LLM (GPT-3, Neo-j, LLAMA, Falcon, GigaChat, RuGPT).
  • Если вы работали над извлечением сущностей и интентов в Маркетплейсах: Ozon, WB, Yandex Market
  • Если вы разрабатывали голосовых асссистентов Маруся, Алиса, Салют.

Условия:

  • Работа в перспективном стартапе над инновационным продуктом. В компании уже 700+ человек.
  • Москва, полная занятость, гибридный график, офис в центре.
  • У нас нет легаси длиной в 20 лет, весь стек разработки от 2023 года.
  • Вся разработка продуктовая, на результат, а не на отчётность.