Data Scientist / ML-инженер (Big Data)

Дата размещения вакансии: 21.06.2022
Работодатель: МТС
Уровень зарплаты:
з/п не указана
Город:
Москва
проспект Андропова 18к9
Требуемый опыт работы:
От 3 до 6 лет

Big Data МТС — место, где телеком данные превращаются в реально работающие IT-продукты. Мы создали и протестировали несколько десятков сервисов. Самые успешные из них уже стали частью экосистемы МТС. Например, МТС Маркетолог, рекомендации в KION (МТС ТВ), услуга «Кто звонит?» или Спам blacklist.

Кого мы ищем?

Сейчас мы ищем Data Scientist’ов и ML-инженеров в следующие продукты:

  • RnD (Senior)

Обязательно:

  • опыт работы от 2 лет в области анализа данных и машинного обучения
  • вы знаете, как работают ML-алгоритмы и не будете тратить время на эксперименты с заведомо плохими решениями
  • понимаете, когда нужно остановиться и использовать вместо ML более простые и быстрые подходы
  • у вас продвинутые знания Python, в т.ч. основных ml-библиотек
  • умеете делать препроцессинг данных на SQL или PySpark
  • умеете работать с git
  • есть базовые навыки работы в Linux/Unix

Желательно:

  • знаете минимум один из классических языков C, Java, Scala, C/C++/C# и есть опыт программирования в прошлом
  • есть опыт вывода ml-решений в продакшн

Что предстоит делать?

  • выгружать и готовить/обрабатывать данные (находить аномалии и инсайты)
  • перебирать гиперпараметры ml-моделей, пока кросс-валидация не даст нормальный результат :)
  • дорабатывать ml-модели из стандартных библиотек
  • проверять бизнес гипотезы в offline и готовить дизайн A/B тестов
  • доводить модель до прода совместно с разработчиками

Что вы найдете в команде Big Data?

Стек технологий:

  • работаем с данными на классическом hadoop-стеке (Spark, Hive)
  • разрабатываем на python3: R&D делаем в Jupyter, продуктивизируем в PyCharm
  • обучаем модели на отдельных мощных машинах с видеокартами Tesla V100
  • используем собственные разработки для скоринга больших данных и MLFlow для экспериментов
  • храним код в gitlab, CI/CD в Jenkins, процессы запускаем в Airflow

Команда: в команде Data Science сейчас 30 человек (во всей Big Data МТС более 300 человек). Все DS поделены на группы со своими лидами — есть группа рекомендательных систем, скоринга и другие. Каждую неделю мы обмениваемся опытом на совместных синках.

DS работают в продуктах со своей автономной командой, в которой есть все роли: аналитики, DE, DS, разработчики, девопсы, менеджеры продукта.

Условия: каждый месяц — аванс и зарплата, дважды в год — премия. ДМС + стоматология, корпоративная связь, специальные предложения от партнеров и друзей МТС, отпуск 31 день в год. Выдаем 16″ MacBook Pro или Dell на выбор.

Есть ли обучение?

  • Локальные конференции, митапы.
  • Корпоративный университет МТС и масштабная виртуальная библиотека.
  • А ещё мы регулярно обмениваемся опытом на совместных синках с лидами экспертизы

Какой график? Гибкое начало рабочего дня в промежутке с 8 до 11. Есть возможность работать несколько дней вне офиса по договоренности с командой.

Сколько этапов при отборе? Не более трех:

  1. HR + первое тех. интервью с лидом направления
  2. Тестовое задание/второе интервью — по необходимости
  3. Собеседование с PO и командой, выбор кандидатом проекта