Программист-исследователь в VK Predict

Дата размещения вакансии: 28.11.2024
Работодатель: VK
Уровень зарплаты:
з/п не указана
Город:
Москва
Ленинградский проспект 39с79
Требуемый опыт работы:
От 3 до 6 лет

Мы создаём продукты и сервисы для клиентов на основе предиктивных моделей с использованием методов машинного обучения и собственной платформы обработки больших данных.

Задачи:

  • готовить ad hoc по существующим моделям и сервисам;
  • разрабатывать модели машинного обучения на новых данных;
  • изучать и обрабатывать данные из разных источников;
  • внедрять регулярный расчёт новых признаков, улучшать мониторинг качества данных;
  • генерировать и проверять гипотезы по улучшению моделей — текущих и будущих;
  • развивать инфраструктуру существующих сервисов;
  • писать продуктивизируемые пайплайны скриптов (не просто Jupyter Notebook) для внедрения моделей, признаков, а также для создания и поддержки функционирования новых продуктов.

Требования:

  • высшее техническое образование по IT-профилю либо экономическое образование с повышением квалификации в MADE VK, ШАД и на других специализированных курсах;
  • релевантный коммерческий опыт от двух лет;
  • умение разрабатывать пайплайны для обработки данных с Python и PySpark;
  • желание расти в ML и DS, а также развивать инфраструктуру development и production;
  • глубокое знание классического машинного обучения;
  • сильная математическая подготовка (особенно в теорвере и статистике), понимание математической базы ML-алгоритмов;
  • уверенное программирование на Python — использование ООП и библиотек NumPy, Pandas, Sklearn, LightGBM, CatBoost, PySpark;
  • знание SQL и основ баз данных.

Будет плюсом:

  • опыт в задачах DE или MLE;
  • опыт работы с PySpark, Hadoop;
  • умение писать bash-скрипты, понимание возможностей командной строки Unix-подобных систем;
  • опыт обработки текстовых данных и последовательностей;
  • знание фреймворка Luigi.