Middle/Senior ML engineer (NLP, LLM)

Дата размещения вакансии: 20.05.2025
Работодатель: СБЕР
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Наша команда занимается задачами, связанными с извлечением информации из неструктурированного контента: документов, диалогов, текстов различной природы.

Главной задачей для нас является создание готовых продуктов с LLM под капотом, а также создание self-service для бизнеса, где каждый может создать нужный ему сценарий обработки данных (скилл) в режиме no-code. Недавно у нас появился инструмент, в котором пользователь может вести чат с документом в режиме копилота, повышая эффективность своей работы.

Мы ждем заинтересованных в NLP коллег, которым интересно как RnD, так и создание E2E-систем для автоматизации бизнес-процессов.

Помимо этого, мы занимаемся AI-агентами для решения комплексных многостадийных задач, связанных с анализом информации из разных источников. Для этих целей разрабатываем собственные инструменты (SDK, библиотеку функций, бенчмарки для оценки агентов).

Некоторые статьи и публичные выступления от нашей команды:

  • Мультимодальные генеративные модели для обработки документов https://www.youtube.com/watch?v=gmr0InUnaKU

  • Понимают ли большие языковые модели данные из таблиц?

https://habr.com/ru/companies/sberdevices/articles/856890/

  • Использование LLM в автоматизации рутинных задач https://habr.com/ru/companies/sberdevices/articles/806133/

Задачи:

• Развитие прикладных LLM-технологий для задач извлечения и генеративного поиска (RAG)

• Дообучение (LoRA) мультимодальных больших языковых моделей с фокусом на домене документов

• Разработка AI-агентов и мультиагентных систем

• Организация и автоматизация процесса разметки (от поиска и подготовки данных до анализа ошибок разметки)

• Релизы новых моделей в среды исполнения для наших пользователей

Наши ожидания:

• Опыт работы с LLM, промпт-инжиниринг, дообучение трансформерных моделей

• Опыт в ML-разработке одной или нескольких типов моделей: Text classification, NER, QA

• Отличное знание PyTorch, Numpy, Sklearn, Pandas

• Python3, ООП, SOLID

• LLMOps: LangChain, LlamaIndex, опыт работы с инструментами для LLM

• Желание изучать новые подходы, модели и технологии

Плюсом будет:

- Хороший профиль на GitHub

- Медальки на Kaggle

- Статьи по NLP/LLM на международных конференциях

- Участие в open-source проектах с LLM

- Опыт оптимизации и ускорения моделей для прода (прунинг, квантование, ONNX/TensorRT)

- MLOps: Git, Docker, MLFlow/DVC/ClearML, Airflow

- Хорошее знание алгоритмов и структур данных

Условия

  • комфортный современный офис рядом с м. Кутузовская
  • гибрид (2 раза в неделю офис)
  • ежегодный пересмотр зарплаты и годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС + страхование для семьи
  • ипотека для сотрудников выгоднее до -1/3 от текущей процентной ставки
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.