Обязанности:
Спектр задач представляет из себя непрерывный поток аналитики и разработки (в т.ч. с применением ML-моделей) продвинутых контролей качества данных, что включает в себя:
• Разработка пайплайнов для автоматизированного контроля качества данных на основе ML-моделей.
• Создание прототипов моделей для выявления аномалий, дрейфа данных и нарушений бизнес-правил, их валидация на исторических данных, подбор оптимальных гиперпараметров.
• Интеграция разработанных моделей в существующие ETL-процессы и систему контроля качества данных с обеспечением возможности быстрой переобучения и версионирования.
• Настройка алертинга на основе прогнозов моделей для операционных команд, включая настройку порогов чувствительности и механизмов подавления ложных срабатываний.
• Сопровождение решений в production-режиме, анализ причин ошибочных предсказаний, планирование доработок и актуализация моделей при изменении закономерностей в данных.
Требования:
• SQL - умение создавать сложные запросы с использованием аналитических оконных функций и использовать инструменты профилирования для оптимизации их производительности, опыт работы с БД Oracle, Postgres, Greenplum;
• Уверенное знание и опыт работы с инструментами разработки, планирования и мониторинга рабочих процессов (workflow engines) пакетной обработки данных - Airflow;
• Написание кода на Python для разработки ML-моделей и сопутствующей аналитики (в т.ч. опыт работы с библиотеками Pandas, Numpy, skLearn). Очень приветствуется опыт работы с pyspark.
• Опыт разработки классических ML-моделей (линейные, деревья, бустинги и т.п.). Знание методов обработки данных (подготовки датасетов для обучения), метрик оценки качества. Понимание принципов работы классических алгоритмов ML-моделей.
• Опыт аналитической работы с данными, понимание методов математической статистики.
Условия:
• Стабильную работу в одном из крупнейших банков страны
• Сильное DS community, большое разнообразие рабочих и внерабочих активностей.
• Конкурентную заработную плату, соцпакет.
• Условия для роста и развития (в т.ч. конференции, тренинги, внутренние программы развития).
• Дружный коллектив единомышленников (все специалисты, занимающиеся машинным обучением объединены одним департаментом для максимально плотного и продуктивного обмена знаниями).
• Передовой стек технологий, высокопроизводительное оборудование.
• Возможность решать разнообразные прикладные задачи с выводом в промышленную эксплуатацию, возможность существенно влиять на результат (в т.ч. в бизнес-смысле) и способы его достижения (вплоть до внесения изменений в архитектуру).
• Квартальный бонус по результатам работы;
• ДМС, страхование жизни;
• корпоративное обучение