Инженер данных в отдел аналитики

Дата размещения вакансии: 06.09.2024
Работодатель: Лемана ПРО (Леруа Мерлен)
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Наша компания — это data-driven компания с передовыми ИТ технологиями, в том числе с внутренней разработкой. Мы переосмысливаем DIY ритейл в России. Продукты, над которыми мы работаем: сайт, мобильные приложения для клиентов и сотрудников, ПО для магазинов, DATA продукты, платформенные решения для работы с товарным предложением, логистикой, создания и управления микросервисами, коммуникаций с клиентами и многие другие.

Задачи позиции:

  • Поддержка настроенной интеграции данных Google Analytics и FireBase в DataLake (Greenplum)
  • Разрабатывать схемы подключения новых источников в DataLake
  • Принимать участие в архитектурных решениях
  • Разрабатывать процедуры формирования детального слоя данных и слоя витрин DataLake
  • Создавать и улучшать процессы обработки данных
  • Реализовывать процессы CI/CD и мониторинга разработанных процессов обработки данных (Grafana, Prometheus)
  • Создание manual и automated DQ тестов
  • Документирование работы в Confluence

ОБЯЗАННОСТИ:

  • Поддержка настроенной интеграции данных Google Analytics и FireBase в DataLake (Greenplum)
  • Разрабатывать схемы подключения новых источников в DataLake
  • Принимать участие в архитектурных решениях
  • Разрабатывать процедуры формирования детального слоя данных и слоя витрин DataLake
  • Создавать и улучшать процессы обработки данных
  • Реализовывать процессы CI/CD и мониторинга разработанных процессов обработки данных (Grafana, Prometheus)
  • Создание manual и automated DQ тестов
  • Документирование работы в Confluence

ТРЕБОВАНИЯ:

  • Понимание принципа работы MPP баз данных (в частности Greenplum)
  • SQL с навыком оптимизации запросов (чтение плана, оценка, оптимизация)
  • Apache Spark - хотя бы понимание что это и для чего используется. В нашем случае актуален pyspark, но если был опыт со scala + spark, то это ок.
  • S3, хотя бы понимание что это и для чего
  • Airflow, понимание на хорошем уровне (как писать даги, архитектура, best practice).
  • Понимание CI/CD, большой плюс, если есть опыт настройки процессов
  • Опыт работы с системами контроля версий (Git)
  • Data Quality, хотя бы понимание зачем это надо

Что мы готовы предложить:

  • работу в компании с развитой инженерной культурой;
  • гибкую систему премирования;
  • расширенный социальный пакет: ДМС со стоматологией с первого месяца работы, психолог и страхование жизни, компенсация питания и оплата мобильной связи;
  • возможности профессионального роста, программы развития для сотрудников;
  • корпоративное обучение и доступ к базе знаний;
  • внутренние профессиональные сообщества и мероприятия;
  • автономность работы, возможность менять правила, ошибаться и создавать новое;
  • гибридный формат работы;
  • современный офис в 2 минутах ходьбы от МЦК ЗИЛ.