Наш стек: Greenplum, Trino, Apache Airflow, ClickHouse, Python, Spark, SQL (dbt), S3, Hadoop
Обязанности:
- Сбор требований с бизнес-заказчиков и анализ источников данных
- Разработка, реализация и поддержка интеграционных потоков, а также потоков сборки витрин-данных на стеке технологий, принятых в команде: Trino, Iceberg, S3, Spark, Apache Airflow, Kafka, Cosmos, Flink
- Оперативное реагирование на информацию о проблемах в зоне ответственности, выполнение типовых задач в установленный срок
- Поддержание в актуальном состоянии документации типовых интеграционных решений платформы больших данных. Предоставление отчетности о своей деятельности руководителю.
Требования:
Общее представление о стеке технологий Lakehouse
- Понимание различия работы между BigData/Lakehouse и с данными обычного размера
- Знание SQL (индексы, функции, оптимизация, профилирование производительности
- Знание языков программирования (JAVA, Python)
- Опыт работы c реляционными БД (Oracle, Postgres, MySQL, MsSQL,т.п.)
- Умение работать с Git (знание команд git pull/commit/push)
- Опыт работы с DBT, Cosmos, Ni-Fi
- Опыт разработки на Spark
- Понимание особенностей Trino
- Понимание форматов данных Iceberg, Parquet, Avro
- Понимание работы с minio или любого другого хранилища на основе S3
- Опыт использования системами ведения проектов и документации.
Условия:
- B2B Контракт, ИП.
- Гибкий график
- Корпоративные курсы английского
- 3 оплачиваемых sick day в год
-
Профессиональный рост и развитие в сильной команде
-
Современный стек и выстроенные процессы
-
Долгосрочное сотрудничество