Middle/Senior Data Scientist

Дата размещения вакансии: 16.05.2025
Работодатель: WILDBERRIES
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Мы ищем опытного Data Scientist в команду разработки WB Space — платформы для проведения ML-соревнований. В этой роли вы будете разрабатывать ML-проекты соревнований, лучшие решения которых смогут масштабироваться в продуктовые ML-модели и использоваться в реальных бизнес-процессах. Это позволит привлекать сильных специалистов и напрямую влиять на ключевые бизнес-показатели компании.

Чем предстоит заниматься

  • Разрабатывать ML-задачи для соревнований, учитывая бизнес-потребности;
  • Подбирать и разрабатывать метрики оценки для ML-соревнований;
  • Консультировать заказчиков по постановке задач и выбору метрик;
  • Создавать baseline-решения и анализировать данные, применяя подходящие алгоритмы ML;
  • Визуализировать результаты и представлять их команде;
  • Формировать задачи, конечным решением которых будет Docker-образ;
  • Поддерживать участников на всех этапах соревнований;
  • Взаимодействовать с вузами, курировать студенческие проекты и образовательные инициативы.

Какой опыт и знания нужны

  • Глубокие знания алгоритмов и структур данных;
  • Уверенное владение Python (NumPy, Pandas, Scikit-learn, PyTorch/TensorFlow);
  • Сильный математический бэкграунд в линейной алгебре, вероятности и статистике;
  • Глубокое понимание классического машинного обучения и основ Deep Learning;
  • Опыт обучения и дообучения нейросетей на PyTorch;
  • Практический опыт работы с задачами NLP, Time Series, CV, RecSys (от 2 лет);
  • Опыт контейнеризации и работы с Docker;
  • Навыки инференса моделей, разработки и деплоя ML-сервисов.

Будет плюсом

  • Опыт преподавания или ведения образовательной практики в области машинного обучения;
  • Опыт выкатки моделей в production;
  • Опыт работы с большими данными, применения распределённых вычислений;
  • Опыт решения задач Classification, Object Detection, Segmentation, Anomaly Detection, OCR.

Наш стек
Python, Go, ClearML, Prometeus, Grafana, Docker, PyTorch, Airflow, Postgres, Clickhouse, K8s, FastAPI, Gitlab, PyTorch, Tensorflow, ONNX

Мы предлагаем

  • Интересные задачи, и исследовательские, и прикладные, возможность переключаться между ними и видеть улучшения от них в production;
  • Большие данные, сотни миллионов товаров, миллиарды действий пользователей в день, ресурсы и инфраструктуру, необходимые для работы с ними;
  • Гибридный или удаленный формат работы с гибким началом рабочего дня;
  • Бесплатное питание в наших офисах;
  • Скидки на фитнес и образовательные программы.