Москва
Чем предстоит заниматься:
- Разработка и поддержка архитектуры DataLake;
- Создание ETL(ELT)-процессов для интеграции данных из различных источников;
- Работа с большими объемами данных, их хранение и обработка;
- Сотрудничество с командами аналитиков и разработчиков для понимания требований к данным и их структурированию;
- Обеспечение качества и целостности данных.
Мы ждем от кандидата:
- Опыт построения архитектуры базы данных;
- SQL и Python на продвинутом уровне;
- Опыт работы с Hadoop и Pyspark;
- Опыт работы с Docker и K8S;
- Опыт работы с Gitlab и CI&CD;
- Опыт работы с linux.