Data Scientist NLP

Дата размещения вакансии: 26.11.2024
Работодатель: СБЕР
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Команда продукта «Интеллектуальная система управления руководителя» создает продукт, который включает AI-сервисы для повышения эффективности работы руководителя:

  • голосовой Виртуальный Ассистент на базе «Салют» (навыки работы с текстом, аудио, поиск информации по корпоративной базе знаний)
  • Knowledge Assistant с использованием LLM для поиска и работы с информацией в корпоративной базе знаний
  • сервис Speech2Text + LLM для автоматического протоколирования совещаний
  • LLM для саммаризации протоколов совещаний, почты, заметок и пр.
  • LLM и др. генеративные модели для генерации текстов (писем, заметок), презентаций, документов
  • OCR и LLM для распознавания и работы с документами (саммаризация, комментарии к материалам)
  • взаимодействие ведется с командами внутри Блока, подразделениями Блока Технологии (SberDevices), Департаментом ИИ (AI Lab, Sber AI), Управлением валидации.

Обязанности

  • сбор, анализ и агрегирование научной, технической и продуктовой информации из открытых источников по направлениям: Генеративный ИИ, Мультимодальные LLM, NLP, Speech-to-Text, Text-to-Speech, и др.
  • анализ трендов в области ИИ
  • прототипирование гипотез и AI моделей
  • консультирование/Участие в разработке продуктовых версий моделей
  • участие в разработке AI стратегии развития продукта
  • тесное взаимодействие с бизнес-заказчиком для выявления требований к AI-компоненте продукта
  • консультирование / участие в автоматизации источников данных для ML моделей совместно с ML Engineer/Data Engineer.

Требования

  • образование в техническом ВУЗе в сфере компьютерных наук, прикладной математики или статистики. Наиболее приоритетны: МФТИ, ВШЭ, МГУ, Сколтех, НГУ, МИФИ
  • глубокое понимание ML/DL алгоритмов, NLP и LLM
  • опыт написания научных статей по машинному обучению или близкой сфере: В приоритете NLP, Speech2Text, статистика
  • опыт презентации результатов научных работ на конференциях
  • опыт разработки научных прототипов ML моделей
  • опыт участия в разработке промышленных ML моделей (будет плюсом);
  • умение переводить бизнес-постановку задачи в ML-постановку, грамотная интерпретация полученных результатов
  • высокий уровень владения ядром Python и SQL
  • свободное владение базовыми библиотеками на Python, в том числе: pandas, numpy, matplotlib, seaborn
  • знание фреймворков, библиотек, алгоритмов машинного обучения: Scikit-learn, Pytorch, xgboost, catboost, tensorflow, transformers
  • технический английский статьи, документация)
  • преимущество: pet-projects на Github, владение Confluence, Jira, медали на Kaggle, готовность брать на себя коммуникацию с бизнес-заказчиком, опыт DS-менторства
  • PhD (будет преимуществом).

Условия

  • стабильный оклад и социальная поддержка сотрудников
  • расширенное ДМС с первого дня работы для сотрудников и льготная медицинская страховка для близких
  • льготные условия кредитования для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров: СберМаркет, Самокат, Еаптека, Мегамаркет
  • корпоративная пенсионная программа
  • корпоративное обучение за счет компании
  • реферальная программа для сотрудников: можно пригласить в команду знакомых профессионалов и получить вознаграждение до 100 тыс. рублей
  • корпоративный спортзал и скидки в спортзалы-партнеры
  • скидки на продукты Сбера и компаний-партнеров.