з/п не указана
Москва
Ленинградский проспект 35с1
Ленинградский проспект 35с1
От 3 до 6 лет
НЕМНОГО О ПРОЕКТЕ:
Мы находимся на ключевом этапе трансформации нашей аналитической платформы. Основная задача — участие в масштабном проекте миграции хранилища данных с Oracle на Greenplum и последующего перехода на современную LakeHouse-архитектуру.
СТЕК: SQL, Python, Greenplum, Apache Airflow, DBT, Trino, Apache Iceberg, Clickhouse, OpenMetadata
ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ:
- Участвовать в проекте миграции хранилища с Oracle на Greenplum и переходе на LakeHouse
- Декомпозировать схемы Oracle, писать S2T-маппинги, участвовать в переносе данных и логики в Greenplum
- Строить витрины в новом стеке (Trino + Iceberg) через DBT. Выделять главные сущности (клиенты, заказы), продумывать правила слияния и очистки данных
- Писать скрипты (SQL/Python) для проверки данных, документировать всё в DBT, вести каталог
НАШИ ПОЖЕЛАНИЯ К КАНДИДАТУ:
- Опыт в миграции хранилища данных с Oracle на GreenPlum от 3-х лет
- Опыт работы с Greenplum (или аналогами) от 3-х лет
- Очень уверенный SQL (сложные запросы, оптимизация)
- Понимание, как строятся хранилища и витрины данных
- Умение разбирать чужой код/схемы (особенно Oracle) и писать ТЗ на ETL