Санкт-Петербург
Обязанности:
- Общаться с бизнес-аналитиком со стороны заказчика.
- Разработка кода для формирования витрин данных.
- Отработка гипотез и поиск оптимальной модели.
- Построение интерпретируемых моделей.
- Внедрение модели в промышленную среду.
- Улучшение действующих моделей.
Требования:
- Наличие реализованных и внедренных решений (наличие репозитория с проектами).
- Умение интерпретировать и обосновывать результаты работы моделей в доступном для бизнеса формате.
- Опыт постановки и проведения ad-hoc исследований, оценка их качества.
- Понимание основных алгоритмов ML (линейные, ядерные модели, наивный байес, деревья, случайный лес, градиентный бустинг), метрик качества и функций потерь. Умение обосновать выбор модели/метрики/функции потерь для конкретной задачи.
- Опыт предобработки сырых данных (заполнение пропусков, обработка выбросов и т.п.).
- Умение отобрать важные признаки и сгенерировать новые из текущего набора.
- Хорошие навыки программирования:
- Python (обязательно: pandas, numpy, scikit-learn, matplotlib/plotly/аналог, xgboost + lightgbm/catboost; желательно: shap, hyperopt/optuna/аналог, keras/tensorflow/pytorch).
- SQL (сложные запросы, индексы, оконные функции).
- Желателен опыт работы с Hadoop: общее понимание архитектуры, Hive (HiveQL), Spark (PySpark/Scala).
- Опыт работы с linux терминалом.
- Знакомство с методологией Agile и основными фреймворками.
- Опыт работы в Git (используем BitBucket), Jira, Confluence приветствуется.
- Готовность изучать новое, исследовать международный опыт и делится знаниями.
Условия:
- Возможность профессионального и карьерного роста в компании
- Возможность поучаствовать в разных проектах
- Опыт работы в распределенной команде профессионалов
- Уровень заработной платы обсуждается индивидуально
- Формат работы: Гибрид: Санкт-Петербург