Основная наша цель - это создание и эффективное внедрение ML моделей для решения бизнес - задач в Банке. Мы ищем инженера данных, который поможет обеспечивать ML инженеров надёжными и качественными данными.
Вам предстоит организовывать хранение и обработку большого объема данных, обеспечивать процессы для подготовки витрин данных.
ЧЕМ БУДЕШЬ ЗАНИМАТЬСЯ?
- Проектировать и разрабатывать витрины для моделей машинного обучения, аналитики моделей;
- Разрабатывать и внедрять ETL/ELT пайплайны обработки данных, метрики моделей;
- Внедрять модели на больших данных.
МЫ ЖДЕМ, ЧТО ВЫ:
- Работали с DWH решениями (Greenplum/ClickHouse/Vertica и другие);
- Отлично владеете SQL (вложенные запросы, оконные функции, оптимизация запросов);
- Уверенно пишете код на Python;
- Имеете опыт применения Spark/PySpark;
- Работали с Unix OS, bash, Git;
- Имеете опыт работы с Airflow, Dbt.