Data Engineer в ML команду

Дата размещения вакансии: 15.03.2025
Работодатель: X5 Digital
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Наш стек: Linux, Bash, SQL, Spark (PySpark), Hive,S3, Airflow, JupyterLab, Kafka, PostgreSQL, GreenPlum, ClickHouse, MLFlow.

Чем предстоит заниматься:

  • управлением источниками данных и подключение новых;
  • снабжением коллег данными своевременно и бесперебойно;
  • разработкой Flow подготовки данных для моделей машинного обучения с тестами и проверкой простых NFR;
  • продуктивизацией ML моделей;
  • взаимодействием с коллегами по вопросам подключения источников данных.

Пожелания к опыту:

  • опыт работы Data инженером от 3 лет;
  • опыт с Big Data, Hive, Kafka;
  • уверенные знания Python 3, PyTest;
  • базовые знания алгоритмов и структур данных;
  • опыт работы с Linux, Airflow;
  • умение подключать новые источники данных, работать с текущими, дорабатывать DataSet и не избегать версионирования;
  • умение разрабатывать и тестировать ETL-процедуры.

Будет плюсом:

  • опыт работы c Bash, MLFlow, Hadoop, JupyterLab, Spark, ClickHouse, PostgreSQL, GreenPlum.