Middle Data Scientist

Дата размещения вакансии: 20.09.2024
Работодатель: СБЕР
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 1 года до 3 лет

Вам предстоит создавать модели машинного обучения для системы форд-мониторинга Сбербанка, которая обеспечивает защиту клиентов банка во всех каналах обслуживания от мобильных приложений и покупок в интернет до визитов клиентов в офисы.

Наша команда принимает активное участие в развитии этой системы и сосредоточена на разработке и внедрении AI-моделей по выявлению мошенничества.

Вам предоставляется возможность поработать с действительно большими объемами данных и сделать значимый вклад в борьбу с мошенничеством в стране.

Обязанности

  • Разработка и развитие моделей и алгоритмов противодействия мошенничеству: скоринг транзакций для выявления фрода/«отмывания» средств, оценка риска сущностей (клиенты, устройства и пр.), анализ и выявление связей, транзакционных аномалий и пр. (В основном бустинги)
  • Развитие инструментов воспроизводимости и версионирования моделей машинного обучения
  • Мониторинг и регулярный контроль качества работающих в пром. моделей;
  • Анализ доступных источников данных и информации в них, оценка качества для решения задач;
  • Построение воспроизводимых и переиспользуемых решений для работы с данными и моделями
  • Обсуждение задач и методов их решения совместно с фрод-аналитиками и бизнес-заказчиками, формулирование гипотез и их проверка;
  • Взаимодействие с командами инженеров и участие в интеграции решений в промышленную эксплуатацию;

Требования

  • Опыт использования библиотек анализа данных и построения ML моделей на Python (xgboost/lightgbm/catboost, numpy/pandas/dask, sklearn, …), понимание особенностей и границ применимости;
  • Умение использовать инструменты версионирования, сохранения артефактов и воспроизводимости моделей машинного обучения (Git, DVC, MLflow…)
  • Опыт автоматизации пайплайнов работы с данными (Airflow и др.)
  • Знание мат. статистики и теории вероятностей
  • Хорошее понимание методов машинного обучения с точки зрения математики и умение адаптировать их под конкретные задачи

Будет плюсом:

  • Опыт работы с PySpark, Hive
  • Успешное участие в соревнованиях по машинному обучению
  • Знание pytorch
  • Опыт работы с AutoML
  • Опыт работа в сфере противодействия мошенничеству/AML

Условия

  • Молодая и активная команда, состоящая преимущественно из DS и DE.
  • Наличие мощного кластера и сред разработки, включая GPU
  • Возможность поработать с действительно большими объемами данных и сделать значимый вклад в борьбу с мошенничеством в стране
  • Полностью офисный формат работы - Кутузовский проспект 32к3