Мы в поиске System Analyst в направление больших данных, который будет участвовать в значимых для инфраструктуры данных проектах.
Результатами нашей работы пользуются аналитики, DS-инженеры, маркетинг и другие команды. У нас много разных хранилищ, и неформализованных подходов. Мы хотим прийти к единой системе с понятными правилами, инструментами и набором стандартов.
Чем предстоит заниматься:
-
Собирать и прорабатывать требования продуктовых аналитиков и DS к ETL пайплайнам данных и улучшать процесс сбора требований;
-
Участвовать в подключении новых источников данных и внедрении инструментов для работы с ними;
-
Ставить задачи разработчикам на создание нового функционала в платформе данных и пайплайнов данных;
-
Участвовать в тестировании систем и данных, искать проблемы багов, расследовать инциденты в данных;
-
Писать документацию к платформе данных и к данным, помогать пользователям платформы;
-
Развиваться в BigData технологиях (Hive, Trino, Hadoop, Spark).
Мы ожидаем:
-
Уверенное знание SQL (умение писать и оптимизировать сложные запросы);
-
Опыт проектирования физической модели данных БД;
-
Умение читать и составлять диаграммы (UML, BPMN);
-
Базовое знание одного из языков программирования (Python, Java и тд);
-
Знание английского языка достаточное для чтения технической документации.
Будет плюсом:
-
Умение работать с Git и Gitlab/Github/Bitbucket, понимание, что такое CI/CD;
-
Опыт участия в проекте разработки информационных систем;
-
Базовое знание BigData технологий (Airflow, Hive, Hadoop, Spark).