Москва
Ленинградский проспект 39с79
Ленинградский проспект 39с79
Мы создаём продукты и сервисы для клиентов на основе предиктивных моделей с использованием методов машинного обучения и собственной платформы обработки больших данных.
Задачи:
- готовить ad hoc по существующим моделям и сервисам;
- разрабатывать модели машинного обучения на новых данных;
- изучать и обрабатывать данные из разных источников;
- внедрять регулярный расчёт новых признаков, улучшать мониторинг качества данных;
- генерировать и проверять гипотезы по улучшению моделей — текущих и будущих;
- развивать инфраструктуру существующих сервисов;
- писать продуктивизируемые пайплайны скриптов (не просто Jupyter Notebook) для внедрения моделей, признаков, а также для создания и поддержки функционирования новых продуктов.
Требования:
- высшее техническое образование по IT-профилю либо экономическое образование с повышением квалификации в MADE VK, ШАД и на других специализированных курсах;
- релевантный коммерческий опыт от двух лет;
- умение разрабатывать пайплайны для обработки данных с Python и PySpark;
- желание расти в ML и DS, а также развивать инфраструктуру development и production;
- глубокое знание классического машинного обучения;
- сильная математическая подготовка (особенно в теорвере и статистике), понимание математической базы ML-алгоритмов;
- уверенное программирование на Python — использование ООП и библиотек NumPy, Pandas, Sklearn, LightGBM, CatBoost, PySpark;
- знание SQL и основ баз данных.
Будет плюсом:
- опыт в задачах DE или MLE;
- опыт работы с PySpark, Hadoop;
- умение писать bash-скрипты, понимание возможностей командной строки Unix-подобных систем;
- опыт обработки текстовых данных и последовательностей;
- знание фреймворка Luigi.