Каждый день миллионы людей пользуются поиском Яндекса, Картами и Навигатором, посещают сайты партнёров из Рекламной сети Яндекса. На всех этих площадках размещается реклама наших бизнес-клиентов. Мы ищем инженера данных, который поможет обеспечивать аналитиков данных надёжными и качественными данными.
Вам предстоит создавать по разработанной бизнес-логике бесперебойные процессы для подготовки витрин данных, которые позволят коллегам быстро собирать отчёты на основе данных, а бизнесу принимать стратегические решения.
Какие задачи вас ждут
Взаимодействие с коллегами
Вы будете общаться с коллегами внутри команды и заказчиками для понимания бизнес-процессов и основных сущностей.
Работа с данными
Вам предстоит проектировать и разрабатывать процессы обработки и хранения данных, поддерживать качество и полноту данных, готовить регулярные и ad-hoc отчёты.
Мы ждём, что вы
- Работали с Git
- Уверенно программируете на Python, понимаете и используете ООП
- Уверенно владеете SQL (join, агрегации, оконные функции)
- Строили ETL/ELT-процессы
- Понимаете принципы и подходы построения хранилищ данных
Будет плюсом, если вы
- Работали с Apache Hadoop и Apache Spark
- Использовали Airflow, Luigi или другой оркестратор
- Создавали хранилища данных по модели Data Vault или Anchor Model
- Занимались рефакторингом, ревью кода
- Понимаете CI/CD
- Работали с ClickHouse, PostgreSQL, Greenplum, BigQuery и другими БД
- Знакомы с Docker
- Работали с брокерами сообщений RabbitMQ, Kafka