Москва
Обязанности:
- работа с Hadoop (Impala, Spark) в Jupyter Hub;
- наиболее часто применяемые методы: деревья решений, бустинги, лог.регрессия, различные методы кластеризации, ALS/SVD, методы NLP, нейросети для анализа транзакционных данных, текстовой аналитики, для создания эмбеддингов;
- примеры задач: профилирование и сегментирование клиентов, анализ интересов, склонностей к определенным видам кредитных и некредитных продуктов, к категориям транзакций, прогнозирование уровня удовлетворенности клиентов сервисами банка и каналами взаимодействия, аналитика точек продаж, анализ инвестиционного риск-аппетита клиентов, задачи оптимизации, выявление родственных связей, анализ отзывов в сети Интернет и суммаризация текстов обращений, задачи поиска шаблонов в смс, прогнозирование LTV и др.
- активный knowledge sharing внутри команды и управления, brainstorming;
- выступаем на конференциях, публикуем статьи, по возможности занимаемся RnD;
- ведение проектов по Agile/Scrum в Cфера (аналог Jira и Confluence), Gitlab+BitBucket+MLFlow.
Требования:
- опыт работы в моделировании от 1 года;
- уверенное владение Python, Spark;
- знание алгоритмов ML: деревьев решений и случайных лесов, регрессии, бустингов, кластеризации, временных рядов и др., понимание принципов работы рекомендательных систем и лежащих в основе алгоритмов, опыт работы с текстовыми данными приветствуется (NLP: тематическое моделирование, поиск ключевых слов, анализ тональности, задачи суммаризации, шаблонизации и др.);
- знание DL приветствуется: опыт обучения и использования нейросетей и предобученных моделей (RNN, LSTM, BERT, GPT);
- опыт написания ТЗ, БТ, проектной документации;
- наличие публикаций по ML/DL, опыт выступления на ML-конференциях – как плюс;
- ценится проактивный и творческий подход в решении задач.