Data scientist

Дата размещения вакансии: 23.09.2025
Работодатель: СБЕР
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Мы новое подразделение Сбера, занимающееся созданием инструментов и решений для внутренней безопасности с помощью AI. Наши задачи направлены на развитие AI-агентов, создание RAG, запуск локальных инстансов LLM и их файнтюнинг. Наши планы имеют широкий спектр - начиная от разработки DL-моделей для скоринга, поведенческого моделирования и заканчивая графовыми нейронками для выявления скрытых связей.

Ищем Middle Data Scientist в NLP, который будет разрабатывать AI-агентов, адаптировать LLM под специфику задач, строить RAG-системы. Если ты хочешь иметь возможность погрузиться в глубины LLM и Deep Learning, пробовать новые методы к файнтюнингу LLM, строить AI-агентов, то мы ждем тебя в нашу команду.

Обязанности

  • Создание и развитие решений с задействованием IA-агентов (полноценные мультиагентские системы).
  • Создание Retrieval Augmented Generation (RAG)
  • Разработка и поддержка моделей машинного обучения (ML), включая их обновление и адаптация к меняющимся условиям и требованиям бизнеса.
  • Дообучение и адаптация открытых LLM: файнтюнинг, Self-Supervised Learning, LoRAСоздание системы мониторинга качества моделей и контроль их эффективности.
  • Реализация моделей распознавания объектов и обнаружения артефактов на изображениях.

Требования

  • Опыт в ML от 3 лет.
  • Опыт создания агентов на LangChain или GigaChain.
  • Знание основных концепций промпт-инжиниринга и использования Structured Outputs и Function Calling для моделей.
  • Опыт работы с RAG.
  • Опыт решения бизнес-задач с использованием различных LLM-моделей (BERT, RoBERT, XLNet, LLaMA) не только через Hugging Face, а файнтюниг с PyTorch
  • Запуск LLM локально, понимание чем отличаются LLaMA, Qwen, DeepSeek и пр. будет весомым плюсом.

Что мы оцениваем особо высоко:

  • Проактивность и самостоятельность в работе.
  • Способность брать ответственность за принятые решения и стремление к постоянному развитию профессиональных навыков.
  • Высокая продуктивность и умение быстро осваивать новые направления и подходы.

Желательные компетенции:

  • Опыт работы с задачами Anomaly Detection и Named Entity Recognition / Object Extraction.
  • Навыки работы с потоковыми системами типа Apache Kafka.
  • Владение технологиями видеоаналитики и опыта работы с моделями оценки позы (pose estimation).
  • Хорошее представление о структуре изображений и фильтрации визуальных данных.

Используемые технологии:

  • Python
  • Spring (IoC/DI, beans)
  • Hadoop, Spark, Kafka, Elasticsearch
  • SOAP, REST
  • Bitbucket, Jira, Confluence, Jenkins, OpenShift

Условия

  • Офис\гибрид метро Кутузовская
  • Полностью белая зарплата плюс ежегодная премия.
  • Возможность профессионального роста и корпоративного обучения.
  • Корпоративное медицинское страхование и дополнительные льготы сотрудникам.
  • Программы поддержки здоровья семьи сотрудника.
  • Дополнительные выплаты в экстренных жизненных ситуациях.
  • Привилегированные условия кредитования.
  • Специальные скидки и акции от партнёров компании (спортивные занятия, страховка, путешествия).