Middle+ Data-инженер (Hadoop), платформа обработки данных

Дата размещения вакансии: 12.03.2025
Работодатель: SkillStaff
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет
Мы в поисках Middle+ Data-инженера(Hadoop) на проект по разработке ETL процессов крупного телекома.
Срок привлечения специалиста - до конца 2025 года с возможностью дальнейшей пролонгации.
Формат сотрудничества - ИП или самозанятость.

Чем предстоит заниматься:

  • Разрабатывать и оптимизировать ETL-процессы на стеке Hadoop.
  • Анализировать данные в Hadoop-кластере.
  • Анализировать и исследовать источники (получение доступов, подключение к новым источникам (Clickhouse, GP, Oracle, Kafka и т.д.), оценка объемов, выявление инкрементов, уточнение бизнес-смысла данных и взаимосвязей).
  • Создавать продуктовые витрины в архитектуре DataVault.
  • Разрабатывать DQ проверки согласно разработанному ТЗ.
  • Проводить работы по оптимизации общих процессов в рамках продукта (развитие библиотеки продукта, рефакторинг процессов).

Для нас важно:

  • Релевантный опыт работы в роли Data-инженера от 3-х лет.
  • Опыт работы с GreenPlum, Git.
  • Хорошее знание Python + Spark.
  • Опыт работы с распределенными системами обработки данных (Hadoop, Airflow).
  • Понимание модели данных Data Vault.
  • Знание оболочки Bash.

Главный принцип SkillStaff - Выбирай!

  • ЭКСПЕРТИЗА. Делай выбор в пользу проектов с разным уровнем сложности и экспертных команд, где можно работать с лучшими специалистами и обмениваться опытом.
  • РАЗНООБРАЗИЕ ПРОЕКТОВ. Выбирай из сотен компаний и проектов то, что интересно и полезно для твоего роста. SkillStaff помогает реализовывать ежегодно порядка 500 различных ИТ-проектов для крупного бизнеса.
  • КОМФОРТ. Создавай идеальные условия для своей работы: удаленный формат работы из любой точки РФ.