Наша команда в Банке ВТБ разрабатывает модели машинного обучения во всех основных доменах от NLP, CV до графов и гео, так же мы проводим различные ad-hoc исследования и построение моделей для компаний группы ВТБ. Ищем опытного Data Sceintist с хорошей фундаментальной подготовкой, знанием классических алгоритмов ML и навыками работы с Pytorch
Обязанности:
-
анализ новых источников данных, оценка эффективности новых данных;
-
расширение текущих моделей на большее количество сегментов операций;
-
разработка/улучшение моделей;
-
автоматическое переобучение моделей;
-
анализ неструктурированных данных (аудио) и использование нейросетевых моделей;
-
взаимодействие с заказчиками в рамках проектов по разработке моделей;
-
принимать участие в подготовке и согласовании проектной документации на разработку/ доработку ИС;
-
участие в тестировании моделей.
Требования:
-
высшее физико-математическое / техническое / экономическое образование;
-
основы линейной алгебры, методов оптимизации, теории вероятностей и математической статистики;
-
основы машинного обучения и методов анализа данных;
-
уверенное владение стандартным стеком python-библиотек (pandas, numpy, sklearn, scipy, matplotlib, LightGBM и тд);
-
опыт работы с большими данными, hadoop, hive/impala, spark;
-
знание SQL, pyspark, git;
-
опыт работы в проектах по машинному обучению;
-
знание английского языка на уровне чтения технической и научной литературы в предметной области.
-
Дополнительно будет плюсом:
- опыт работы с задачами NLP и временными рядами;
- опыт работы с графами (networkx, pytorch geometric);
- владение стеком библиотек для работы с гео-данными (geopandas, geopy, shapely, folium);
- опыт в разработке дэшбордов и визуализации данных (dash, streamlit).