Москва
Ленинградский проспект 72к4
Ленинградский проспект 72к4
Обязанности:
- Наполнении корпоративного хранилища данных (DWH) на базе GreenPlum, PostgreSQL или ClickHouse;
- Разработка и настройка ETL/ELT процессов для интеграции данных с использованием Apache Airflow;
- Построение витрин данных для аналитики и отчетности, поддержка актуальности данных;
- Оптимизация и написание SQL запросов;
- Автоматизация процессов обработки, загрузки и трансформации данных с использованием Python.
Требования:
- Опыт работы в качестве инженера данных от полугода;
- Опыт работы с SQL (написание запросов, оптимизация, использование оконных функций, CTE);
- Базовые знания Python и опыт создания скриптов для автоматизации процессов обработки данных;
- Опыт работы с одной из СУБД: GreenPlum, PostgreSQL, ClickHouse;
- Понимание основных принципов проектирования хранилищ данных (DWH);
- Понимание основных моделей данных (звезда, снежинка и прочие);
- Опыт работы с системами оркестрации данных, предпочтительно с Apache Airflow;
- Опыт работы с REST API (Интеграция данных из внешних источников через REST API. Разработка ETL-процессов для обработки и загрузки данных, получаемых через API);
- Базовые знания Docker и Linux;
- Навыки работы с системами контроля версий (Git).
Будет плюсом:
- Опыт работы с системами мониторинга и контроля качества данных;
- Опыт работы с инструментами управления метаданными (Data Catalog);
- Знание bash для автоматизации операций.
Условия:
- Работу в команде профессионалов и творческих людей;
- Достойный уровень дохода (обсуждается индивидуально с каждым кандидатом);
- ДМС после окончания испытательного срока;
- Вкуснейший кофе каждый день;
- Гибкое начало рабочего дня;
- Уютный офис в шаговой доступности от м. Сокол БЦ Алкон.