Серпуховско-Тимирязевская линия метро Полянка
Мы ищем Data Engineer в команду, которая отвечает за разработку и оптимизацию ядра хранилища данных и витрин, проектирование модели данных, диаграмм потоков данных и требований к качеству данных.
Вам предстоит:
-
Разрабатывать объекты ядра хранилища
-
Разрабатывать витрины отчетности
-
Оптимизировать запросы
-
Вести документацию
-
Поддерживать объекты хранилища данных
-
Взаимодействовать со смежными подразделениями
Вы нам подходите, если:
-
Имеете опыт работы с DWH на базе Clickhouse (понимание движков таблиц, индексов, репликации и шардинга)
-
Имеете знания SQL на продвинутом уровне (сложные запросы, аналитические функции и т.д.)
-
Имеете опыт оптимизации запросов
-
Умеете производить трансформацию, унификацию данных
-
Знаете методологии построения DWH (Data Vault, снежинка, якорная модель и т.д.)
-
Имеете опыт работы с реляционными СУБД (PostgreSQL, Oracle, MS SQL и пр.)
-
Имеете опыт работы с одним или несколькими оркестраторами (желательно c Airflow)
-
Имеете опыт работы с системами контроля версий (git)
-
Имеете опыт работы с Apache Spark