Middle NLP engineer (Собеседник)

Дата размещения вакансии: 07.11.2024
Работодатель: СБЕР
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

SberDevices — молодая IT-компания полного цикла, входит в экосистему Сбера. Мы уже выпустили разные девайсы для Умного Дома и создали собственные платформы распознавания речи и жестов.

Мы занимаемся разработкой диалоговой части виртуальных ассистентов Салют и проведением исследований с языковыми моделями. Под капотом у нас самые передовые nlp-технологии, собственный диалоговый движок и огромный простор для экспериментов.

Обязанности

  • создание новых и переработка текущих датасетов для обучения языковых моделей
  • sft-обучение большой языковой модели GigaChat для поддержания новых функций
  • аналитика существующих логов для выявления проблем и возможностей для внедрения новых фичей
  • обучать мультимодальные модели аля text2image, image RAG
  • внедрение новых фичей в продукт с помощью Python.

Требования

  • обладаете навыками программирования на Python и PyTorch
  • имели опыт обучения больших языковых моделей (LLM)
  • имели опыт проведения полного цикла экспериментов: от сбора данных и формирования метрик до поддержки внедрённой фичи
  • имели опыт работы hf/transformers и OpenAI API
  • имеете опыт с SFT/lora/p-tuning для LLM
  • следите за развитием индустрии больших языковых моделей и мультимодальных моделей

Будет плюсом, если вы:

  • имеете опыт работы с диалоговыми системами (виртуальные ассистенты, чат-боты)
  • знаете инструменты аналитики больших логов
  • имеете опыт с dpo
  • успешно выступали в соревнованиях по машинному обучению или являетесь выпускником ШАДа.