Data scientist (AI-агенты)

Дата размещения вакансии: 26.09.2025
Работодатель: СБЕР
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Наша команда занимается разработкой NLP моделей и решений на основе LLM для операционных, интегрированных и ESG рисков. Решаем задачи по построению AI-агентов и мультиагентных систем.

Примеры задач:

  • система гардрейлов для защиты LLM-моделей и AI-агентов Сбера от промпт-атак
  • AI-агент для создания и управления базой знаний для сотрудников и других AI-агентов на основе внутренней документации Банка
  • разработка и интеграция механизмов безопасности в RAG-системы и чат-боты с контролем alignment-политик методами RLHF/GRPO
  • AI-агенты для оценки опер.рисков компаний экосистемы Сбера по внутренним документам, новостям, отчетности и описанию бизнес-процессов
  • мультиагентная система по анализу репозиториев кода на уязвимости бизнес-логики и сверка с требованиями на естественном языке
  • AI-агент DataEngineer для автономного анализа данных, поиска ошибок и аномалий, создания проверок качества данных, создания выгрузок и витрин.

Обязанности:

  • разработка PoC и MVP AI-агентов на основе LLM с использованием фреймворков для работы с LLM, таких как langchain/langgraph
  • помощь и участие на стадии внедрения AI-агентов (вывод в промышленную эксплуатацию)
  • адаптация и обучение LLM Сбера с использованием внутренних и внешних данных (Prompt Tuning, LoRA, SFT, GRPO)
  • решение задач NLP (Classification, Summarization (Ext/Abst), Sentence Compression, Simplification, NER, Semantic Search, Clustering)
  • писать поддерживаемый, читаемый код; участвовать в ревью, обсуждениях и формировании технических подходов
  • курирование стажеров/лидирование Junior DS/кураторство исследовательских работ внутри Сбера и команд из ВУЗов.

Требования:

  • высшее техническое образование с хорошей подготовкой в области математики и алгоритмов
  • знание статистики и ML/DL алгоритмов
  • знание Python и ML-стэка (PyTorch, TensorFlow, Scikit-learn, Pandas, Scikit-learn)
  • опыт проектирования и обучения нейросетевых моделей (от CNN/RNN до трансформеров)
  • опыт построения RAG (классический RAG, GraphRAG, Agentic RAG)
  • умение разрабатывать автономных AI-агентов на langchain/langgraph
  • умение создать и опубликовать собственную python библиотеку
  • знание классических алгоритмов (two pointers, бинарный поиск) и структур данных (куча, стэк, бинарное дерево)
  • знание того, какие типы задач эффективнее решать с помощью процессов/потоков. Умение применять модули threading, asyncio, multiprocessing
  • знание принципов ООП, паттернов проектирования. Умение писать чистый, поддерживаемый код (clean architecture, SOLID)
  • опыт работы с Git (GitFlow), проведения Code Review
  • уверенный английский язык для чтения и анализа научных статей и документации.

Преимуществом будет:

  • опыт написания юнит-тестов на python (pytest)
  • опыт работы с БД (PostgreSQL), написания и оптимизации сложных SQL запросов
  • опыт в соревнованиях (к примеру Kaggle Expert+, или успехи на других платформах)
  • знание других языков программирования (например, C++, Java).

Условия:

  • комфортный современный офис рядом с м. Кутузовская
  • возможность выбрать удобный график – офис/гибрид/
  • годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • регулярные митапы и развитое DS-community
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.