Москва
Мы в поисках Middle+ Data-инженера(Hadoop) на проект по разработке ETL процессов крупного телекома.
Срок привлечения специалиста - до конца 2025 года с возможностью дальнейшей пролонгации.
Формат сотрудничества - ИП или самозанятость.
Формат сотрудничества - ИП или самозанятость.
Чем предстоит заниматься:
- Разрабатывать и оптимизировать ETL-процессы на стеке Hadoop.
- Анализировать данные в Hadoop-кластере.
- Анализировать и исследовать источники (получение доступов, подключение к новым источникам (Clickhouse, GP, Oracle, Kafka и т.д.), оценка объемов, выявление инкрементов, уточнение бизнес-смысла данных и взаимосвязей).
- Создавать продуктовые витрины в архитектуре DataVault.
- Разрабатывать DQ проверки согласно разработанному ТЗ.
- Проводить работы по оптимизации общих процессов в рамках продукта (развитие библиотеки продукта, рефакторинг процессов).
Для нас важно:
- Релевантный опыт работы в роли Data-инженера от 3-х лет.
- Опыт работы с GreenPlum, Git.
- Хорошее знание Python + Spark.
- Опыт работы с распределенными системами обработки данных (Hadoop, Airflow).
- Понимание модели данных Data Vault.
- Знание оболочки Bash.
Главный принцип SkillStaff - Выбирай!
- ЭКСПЕРТИЗА. Делай выбор в пользу проектов с разным уровнем сложности и экспертных команд, где можно работать с лучшими специалистами и обмениваться опытом.
- РАЗНООБРАЗИЕ ПРОЕКТОВ. Выбирай из сотен компаний и проектов то, что интересно и полезно для твоего роста. SkillStaff помогает реализовывать ежегодно порядка 500 различных ИТ-проектов для крупного бизнеса.
- КОМФОРТ. Создавай идеальные условия для своей работы: удаленный формат работы из любой точки РФ.