Senior Data Scientist, моделирование продуктов B2B, Ozon Банк

Дата размещения вакансии: 22.09.2025
Работодатель: Ozon
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Ozon Банк — компания, в которой тесно переплетаются финансы и IT. Мы создаём новые для рынка продукты и сервисы для физических и юридических лиц. Гордимся атмосферой в командах: каждый сотрудник может влиять на процессы и пути к результату.

Мы ищем профессионала, который сможет внести значительный вклад в развитие нашей команды кредитного скоринга для юридических лиц и индивидуальных предпринимателей. Многое мы уже сделали, многое еще предстоит. Нужен человек, знакомый с лучшими практиками рынка. При этом способный генерировать и реализовывать идеи, как превзойти текущие стандарты индустрии. В том числе, комбинируя классический подход, возможности, которые дает цифровая платформа Озон и новые идеи, возникающие в сообществе.

Основной стек: Python, Hadoop, Pyspark, Git, Airflow.

Вам предстоит:

  • Отвечать за разработку и поддержку ML-моделей для работы с юридическими лицами (PD, прогноз выручки, оценка залога и тд)
  • Развивать и поддерживать внутренний фреймворк для разработки моделей и повышения продуктивности работы команды
  • Генерировать и применять в моделях новые фичи на основе новых источников данных, наполнять feature store
  • Участвовать в постановке задачи, находить приоритетные направления для моделирования и прозрачно об этом рассказывать
  • Разрабатывать и поддерживать сервисы для продового расчета моделей
  • Анализировать эффективность моделей в проде, организовывать и дорабатывать мониторинг

Мы ожидаем:

  • Опыт работы в кредитном скоринге от 3 лет
  • Умение работать с данными (анализ, очистка, подготовка, отбор и создание признаков), навыки написания сложных SQL-запросов
  • Хорошее знание теории вероятностей, математической статистики и методов машинного обучения. В том числе знание типовых пайплайнов для построения скоринговых моделей.
  • Опыт работы c пакетами для анализа данных на Python3 (numpy, pandas, polars, scikit-learn, xgboost, lightgbm, catboost, hyperopr, optuna, etc)
  • Общие представления о валидации и способах построения мониторинга моделей

Будет плюсом:

  • Опыт работы с HDFS и Pyspark
  • Навыки создания дагов Airflow и их последующее сопровождение
  • Опыт работы с юридическими лицами, понимание, как устроена отчётность, какие модели и как можно применять для анализа компаний