Junior NLP, LLM Data Scientist (блок "Сеть Продаж")

Дата размещения вакансии: 09.12.2024
Работодатель: СБЕР
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
не требуется

Наша команда занимается сбором, обработкой и анализом обратной связи сотрудников Сбера, а также выявлением и доставкой ТОП-проблем до ответственных сотрудников и руководства Сбера. Для анализа больших объемов данных мы используем продвинутые AI и ML-модели, а также GigaChat, который позволяет структурировать тематики обратной связи, выделять кластеры и формулировать суть.

Наша цель – предоставить нашим пользователям удобные инструменты для решения задач текстовой аналитики с применением передовых технологий в области ИИ, в том числе Generative AI.

Обязанности

  • подготовка и обработка данных, создание эмбеддингов
  • формирование выборок для ML-моделей
  • разработка и сопровождение ML-моделей для обработки текстов из различных источников, поддержка работоспособности текущих моделей, адаптация моделей под новые источники данных
  • оценка метрик качества моделей
  • NLP-задачи: классификация, суммаризация, кластеризация, NER и др.
  • проведение исследований, проверка гипотез с использованием LLM и ML
  • подготовка модельной документации и бизнес-требований на внедрение модели в PROD
  • разработка RAG-пайплайнов, исследование передовых подходов и разработка прототипов для продуктовых задач
  • разработка AI-агентов, промпт-инжиниринг, fine-tuning LLM.

Требования

  • высшее математическое/техническое образование
  • знание основ линейной алгебры, теории вероятностей и математической статистики
  • знание основ машинного обучения (линейные модели, дерево решений, бустинг, бэггинг, kmeans, svd и т.д.)
  • базовые навыки программирования на Python
  • владение Python-библиотеками: transformers, XGBoost, CatBoost, sklearn, pandas, numpy, matplotlib, Spark
  • понимание и опыт практического применения алгоритмов машинного обучения: нейронные сети, композиционные алгоритмы (случайный лес, градиентный бустинг и т.д.) NLP (BERT, TF-IDF)
  • опыт взаимодействия с GPT-like моделями или аналогами
  • опыт написания промптов
  • навыки работы с большим объемом данных
  • понимание основ работы с SQL
  • базовые навыки работы с СУБД PostgreSQL

Условия

  • комфортный современный офис рядом с м. Кутузовская
  • офисный формат работы
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека для сотрудников выгоднее до 4%
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.