ML-инженер

Дата размещения вакансии: 27.02.2025
Работодатель: Rambler&Co
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 1 года до 3 лет

Rambler&Co занимает первое место среди медиахолдингов России по объему аудитории цифровых ресурсов — свыше 45,2 млн человек ежемесячно (по данным Mediascope, Cross Web, 2023). В него входят «Лента.ру», «Газета.Ru», «Чемпионат», портал «Рамблер», «Секрет фирмы» и ряд других медиаактивов. Благодаря различной тематической принадлежности площадок холдинг покрывает почти весь спектр интересов и потребностей различных аудиторий.

Детальнее о проекте

  • Рекомендательная система, которая подбирает для пользователей наиболее релевантный контент, повышая продуктовые метрики;
  • Рекомендации строятся в рантайме на каждый заход пользователя на страницу с рекомендациями;
  • Культура разработки: линтеры, тесты, code review на все выкатки, gitlab CI/CD;
  • Нормальная документация и видео лекции с рассказом о проекте, ориентированные на DS;
  • Команда состоит из 22 человек: DS (6 человек), DA, DE, backend, frontend, PM;
  • Ищем ML engineer, а не классического DS.

Чем предстоит заниматься?

  • Офлайн эксперименты с новыми моделями бустинга + выкатка моделей (не только стандартный подбор фичей и гиперпараметров, но более разнообразные подходы: различные способы сбора датасета, семплирования и фильтрации выбросов, составления таргета и т.д.);
  • Реализация новых фичей в офлайне для обучения и в рантайме для инференса моделей с ними;
  • Новые эмбеддинги для контента и фичи на их основе;
  • Улучшение качества проставления тегов для текстов;
  • Другие NLP проекты;
  • В целом, задачи со всех этапов разработки ML-моделей: от экспериментов с новыми фичами и написания пайплайнов загрузки логов до выкатки моделей в нагруженный прод и добавления новых мониторингов.

Что мы ценим и ищем?

  • DS стек (numpy, pandas, scikit-learn, xgboost/catboost);
  • Классический ML (линейные/деревянные модели, метрики, валидация и т.д.);
  • Код на python и SQL (написание и чтение);
  • Коммерческий опыт разработки от 1.5 лет.

Будет плюсом:

  • ML-модели в проде
  • Рекомендательные системы
  • DL, NLP, pytorch
  • postgres, clickhouse, redis
  • Big data стек: hadoop, hive, pyspark
  • Airflow
  • Bash, git, CI/CD
  • Алгоритмы и структуры данных
  • Тервер, матстат, A/B-тесты
  • В желательных требованиях хоть в каком-то пункте ожидаем хоть какой-то уровень. Чем больше пунктов и уровня, тем лучше.

    Отдельно про soft skills: мы очень ценим мотивированность, инициативность, самостоятельность и умение аргументировать выбор подхода/модели/метрики. Во многих случаях хорошие soft skills могут компенсировать недостаточный уровень hard skills :)

Что тебя ждет?

  • Официальное трудоустройство
  • Топовое оборудование и весь необходимый софт
  • ДМС со стоматологией, офисный врач, доплата больничного листа, корпоративные скидки
  • Современный офис (Даниловская мануфактура, м. Тульская), бесплатный спорт в собственном спортзале от «Лиги Героев»
  • Полный день в офисе, гибридный график или 100% дистанционный формат работы
  • Бесплатная подписка на сервисы партнеров
  • Насыщенная корпоративная жизнь