Middle/Senior Data Scientist

Дата размещения вакансии: 27.06.2024
Работодатель: WILDBERRIES
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 1 года до 3 лет

Wildberries — это не только 9 миллионов заказов и 1 миллиард поисковых запросов в день, но и команда, которая стремится быть на переднем крае технологий и инноваций. Мы используем SOTA-решения в production и постоянно развиваем нашу A/B платформу, поисковой движок и другие проекты.

Мы ищем опытного Data Scientist в команду разработки платформы WB Space для проведения ML-соревнований. Это возможность напрямую влиять на продукты и GMV компании, привлекая талантливых специалистов. Дополнительно предстоит работа с ТОП-ВУЗами: ведение практики, подготовка заданий для проектов студентов и техношколы по ML-направлениям.

Чем предстоит заниматься:

  • Анализировать текущие решения в компании для формирования новых задач;
  • Подбирать, разрабатывать новые метрики для ML-соревнований с учетом бизнес-задач;
  • Консультировать заказчиков по постановке задачи и формированию метрик для ML-соревнований на платформе;
  • Разрабатывать baseline-решения для различных задач в рамках соревнований;
  • Визуализировать данные и представлять результаты;
  • Формировать задачи для ML-соревнований, где конечным решением будет Docker-образ;
  • Вести практику и подготовку заданий для проектов студентов в топовых ВУЗах;
  • Готовить и помогать коллегам реализовывать задания для техношколы по разным ML-направлениям.

Что мы ожидаем:

  • Знание алгоритмов и структур данные
  • Уверенные знания Python
  • Уверенные знания математики для ML
  • Уверенные и глубокие знания классического машинного обучения
  • Уверенные и глубокие знания основ Deep Learning
  • Обучение и дообучение нейросетей на PyTorch
  • Опыт работы с разными типами задач NLP/Time Series/CV/RecSys от 2х лет
  • Опыт работы с Docker-образами
  • Умение делать inference для моделей, проектировать, разрабатывать и разворачивать собственные сервисы

Будет плюсом:

  • Опыт преподавания или ведения практики для студентов в области машинного обучения
  • Опыт выкатки моделей в production
  • Опыт работы с большими данными, применения распределённых вычислений
  • Опыт работы с Gitlab
  • Опыт решения задач Classification, Object Detection, Segmentation, Anomaly Detection, OCR

Наш стек: Python, Go, Mlflow, ClearML, Prometeus, Grafana, Docker, PyTorch, Airflow, Postgres, Clickhouse, K8s, FastAPI, Gitlab, PyTorch, Tensorflow, ONNX