Tech Lead ML

Дата размещения вакансии: 16.06.2025
Работодатель: WILDBERRIES
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Привет!
Мы — ML команда финансовых продуктов Wildberries, крупнейшего маркетплейса Европы с более чем 30 млн пользователей в день. Мы решаем уникальные технологические задачи end-to-end, развиваем высоконагруженную ML-инфраструктуру и выводим модели в production для решения задач бизнеса.

Мы ищем опытного Tech Lead для управления высоконагруженными ML сервисами и создания современной экосистемы для разработки ML-моделей. Вы будете отвечать за архитектуру и техническое развитие платформы для исследований, разработки и промышленного применения ML-моделей, обеспечивая стабильность, масштабируемость и удобство работы для Data Scientists и инженеров.

О команде и проектах

  • Команда Senior MLE, MLIE, DA и backend-разработчиков с продуктовым мышлением

  • Решаем задачи кредитного скоринга, роста клиентской базы, ценообразования

  • Скоринговые модели с ROC-AUC >85 п.п., база клиентов 100 млн+

  • Features store с 15k+ признаков, включая внешние источники

  • Offline сервисы скоринга с имплементацией новых моделей за 10 минут

  • Online сервисы скоринга на Go с capacity 10k+ RPS

  • Минимум бюрократии: от идеи до продакшна — одна неделя

Чем предстоит заниматься

  • Архитектурный дизайн системы: от feature store до serving layer

  • Обеспечение отказоустойчивости и масштабируемости ML-сервисов

  • Внедрение best practices MLOps и code review процессов

  • Руководство командой инженеров (backend, MLOps/DE)

  • Развитие онлайн-сервисов скоринга с нагрузкой 10k+ RPS (Go/Python)

  • Построение отказоустойчивых пайплайнов офлайн-скоринга и доставки данных до потребителя (Airflow, Spark, Kafka)

  • Интеграция и оптимизация GPU-инфраструктуры для обучения и промышленного скоринга (Triton Inference Server, TensorRT, ONNX, quantization)

  • Автоматизация CI/CD для ML-моделей

  • Технический и бизнес мониторинг ML сервисов и качества скоринга (Prometheus, Grafana, Great Expectations)

  • Создание и развитие платформы для R&D: настройка и сопровождение инструментов ClearML/MLflow, DVC, JupyterHub

  • Взаимодействие с командами Data Science и DWH для обеспечения качественных данных, фиче-сторов и удобных рабочих процессов

Требования

  • Опыт работы в роли Tech Lead инфраструктуры от 3 лет

  • Практический опыт построения и поддержки высоконагруженных ML-сервисов (онлайн и офлайн скоринг)

  • Владение требуемым тех стеком

  • Опыт работы с GPU-инфраструктурой, Triton Inference Server, оптимизация моделей для production

  • Знание ML deployment patterns: REST APIs, gRPC, batch processing

  • Знание принципов MLOps, опыт построения CI/CD

  • Опыт построения инфраструктуры для RnD ML моделей будет плюсом

  • Опыт взаимодействия с командами Data Science и DWH, понимание процессов feature engineering и data pipelines

  • Умение принимать архитектурные решения и обеспечивать качество кода

  • Навыки коммуникации и работы в кросс-функциональной команде

Что мы предлагаем

  • Участие в развитии ML-инфраструктуры крупнейшего маркетплейса Европы

  • Работа с современным стеком и передовыми ML-технологиями

  • Возможность влиять на архитектуру ML-платформы с аудиторией 100M+ пользователей

  • Гибкий график и возможность удалённой работы

  • Конкурентная зарплата и социальные гарантии

  • Обучение, конференции и профессиональный рост