Мы делаем антифрод-систему для видеорекламы. Сейчас проект на старте, и нам нужен человек, который поможет построить ML-направление с нуля и будет готов развиваться вместе с продуктом.
Задачи:
-
Анализ потоковых данных HTTP-запросов и браузерных параметров (до 5 млрд строк в месяц)
-
Формирование признаков, выявление закономерностей и аномалий
-
Разработка и внедрение ML-моделей (классические алгоритмы) для оценки легитимности рекламных показов
-
Построение и автоматизация ML-пайплайнов (обучение, деплой, мониторинг)
-
Постоянное улучшение моделей и внедрение новых эвристик
Требования:
-
Опыт в Data Science / ML от 3 лет
-
Глубокие знания классических ML-алгоритмов: деревья решений, бустинг (XGBoost, LightGBM, CatBoost), регрессия, кластеризация, ансамбли, вероятностные модели
-
Уверенное владение Python и библиотеками: pandas, numpy, scikit-learn, xgboost, lightgbm, catboost, statsmodels, imbalanced-learn, matplotlib, seaborn, optuna, mlflow
-
Опыт работы с ClickHouse, SQL, S3, Apache Airflow
-
Навыки построения и поддержки ML в production (деплой, мониторинг качества)
-
Высшее образование (математика, прикладная математика, информатика)
-
Умение работать автономно, без микроменеджмента
❗️Будет плюсом, если:
-
Есть опыт в проектах антифрода / антибота / риск-скоринга
-
Есть опыт работы с потоками данных (Kafka, pub/sub)
-
Есть понимание MLOps-подходов и CICD для ML
-
Знакомы с ClickHouse на уровне продвинутой аналитики
Мы предлагаем:
-
Участие в создании антифрод-системы с нуля
-
Возможность влиять на архитектуру и подходы
-
Полностью удалённая работа
-
Отсутствие бюрократии, звонков и микроменеджмента
-
Долгосрочная перспектива, не проектная работа
-
Рост до ведущего специалиста или руководителя направления
-
Работа в компактной команде с высоким уровнем ответственности (Small Giant)