Привет!
Мы — ML команда финансовых продуктов Wildberries, крупнейшего маркетплейса Европы с более чем 30 млн пользователей в день. Мы решаем уникальные технологические задачи end-to-end, развиваем высоконагруженную ML-инфраструктуру и выводим модели в production для решения задач бизнеса.
Мы ищем опытного Tech Lead для управления высоконагруженными ML сервисами и создания современной экосистемы для разработки ML-моделей. Вы будете отвечать за архитектуру и техническое развитие платформы для исследований, разработки и промышленного применения ML-моделей, обеспечивая стабильность, масштабируемость и удобство работы для Data Scientists и инженеров.
О команде и проектах
-
Команда Senior MLE, MLIE, DA и backend-разработчиков с продуктовым мышлением
-
Решаем задачи кредитного скоринга, роста клиентской базы, ценообразования
-
Скоринговые модели с ROC-AUC >85 п.п., база клиентов 100 млн+
-
Features store с 15k+ признаков, включая внешние источники
-
Offline сервисы скоринга с имплементацией новых моделей за 10 минут
-
Online сервисы скоринга на Go с capacity 10k+ RPS
-
Минимум бюрократии: от идеи до продакшна — одна неделя
Чем предстоит заниматься
-
Архитектурный дизайн системы: от feature store до serving layer
-
Обеспечение отказоустойчивости и масштабируемости ML-сервисов
-
Внедрение best practices MLOps и code review процессов
-
Руководство командой инженеров (backend, MLOps/DE)
-
Развитие онлайн-сервисов скоринга с нагрузкой 10k+ RPS (Go/Python)
-
Построение отказоустойчивых пайплайнов офлайн-скоринга и доставки данных до потребителя (Airflow, Spark, Kafka)
-
Интеграция и оптимизация GPU-инфраструктуры для обучения и промышленного скоринга (Triton Inference Server, TensorRT, ONNX, quantization)
-
Автоматизация CI/CD для ML-моделей
-
Технический и бизнес мониторинг ML сервисов и качества скоринга (Prometheus, Grafana, Great Expectations)
-
Создание и развитие платформы для R&D: настройка и сопровождение инструментов ClearML/MLflow, DVC, JupyterHub
-
Взаимодействие с командами Data Science и DWH для обеспечения качественных данных, фиче-сторов и удобных рабочих процессов
Требования
-
Опыт работы в роли Tech Lead инфраструктуры от 3 лет
-
Практический опыт построения и поддержки высоконагруженных ML-сервисов (онлайн и офлайн скоринг)
-
Владение требуемым тех стеком
-
Опыт работы с GPU-инфраструктурой, Triton Inference Server, оптимизация моделей для production
-
Знание ML deployment patterns: REST APIs, gRPC, batch processing
-
Знание принципов MLOps, опыт построения CI/CD
-
Опыт построения инфраструктуры для RnD ML моделей будет плюсом
-
Опыт взаимодействия с командами Data Science и DWH, понимание процессов feature engineering и data pipelines
-
Умение принимать архитектурные решения и обеспечивать качество кода
-
Навыки коммуникации и работы в кросс-функциональной команде
Что мы предлагаем
-
Участие в развитии ML-инфраструктуры крупнейшего маркетплейса Европы
-
Работа с современным стеком и передовыми ML-технологиями
-
Возможность влиять на архитектуру ML-платформы с аудиторией 100M+ пользователей
-
Гибкий график и возможность удалённой работы
-
Конкурентная зарплата и социальные гарантии
-
Обучение, конференции и профессиональный рост