Москва
Обязанности:
- Анализ и исследование источников (оценка объемов, выявление инкрементов, уточнение бизнес-смысла данных и взаимосвязей);
- Анализ данных в Hadoop-кластере;
- Разработка спецификаций по загрузке DDS слоя. Описание трансформаций данных, схемы потоков данных, регламентов, маппингов S2T и определения критериев готовности;
- Создание спецификаций для прототипов витрин слоя CDM и DM. Проектирование структуры витрин;
- Детальная проработка требований по метрикам от заказчика. Уточнение и описание алгоритмов, согласование;
- Формирование справочников CDL для НСИ.
Требования:
-
SAS
-
Hadoop
-
Spark
-
Airflow
-
Python
-
Понимание модели данных Data Vault
-
Bash
-
GreenPlum
-
Git