ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ:
-
собирать, анализировать, формализовать требования к разрабатываемым решениям (модели данных хранилища, витрины данных для аналитической отчётности);
-
проводить анализ систем источников данных для ETL процессов;
-
формировать проверки качества данных;
-
проводить декомпозицию задач, формировать описания для инженеров данных и разработчиков сервисов;
-
заниматься подготовкой технической документации на формируемые структуры данных;
- описывать процессы и алгоритмы обработки данных в хранилище.
ЧЕГО МЫ ЖДЕМ:
-
Продвинутый уровень SQL;
-
уверенный уровень программирования на Python для анализа данных;
-
знание методологий построения DWH;
-
достаточен опыт работы с одной из перечисленных аналитических баз данных (ClickHouse, Greenplum, Vertica и пр.).
БУДЕТ ПЛЮСОМ:
-
Опыт работы с потоковой обработкой информации;
-
понимание классических алгоритмов и структур данных.