Яндекс Лавка — это новый формат магазина у дома. Наша служба формирует актуальные, полные и правдивые данные и отчёты Лавки. Мы ищем инженера данных, который совместно с аналитиками будет проектировать и оптимизировать сложнейшие расчёты и алгоритмы, разрабатывать инструменты для сотен бизнес-пользователей.
Какие задачи вас ждут:
- Работа с данными
Вам предстоит оптимизировать нетривиальные ETL-процессы обработки больших данных и работать с данными на каждом этапе их трансформации: от появления информации в конкретном источнике до отображения в BI. Вы займётесь поддержкой и модификацией созданных решений, будете обеспечивать доступность сервиса и корректность данных для принятия решений.
- Взаимодействие с коллегами
Вы будете совместно с командой аналитиков реализовывать стабильный расчёт бизнес-метрик
Мы ждём, что вы:
- Уверенно программируете на Python
- Хорошо знаете SQL и понимаете устройство современных реляционных баз данных
- Разрабатывали ETL/ELT-процессы и проектировали хранилища данных
- Разбираетесь в классических алгоритмах и структурах данных
Будет плюсом, если вы:
- Знакомы со стеком технологий Hadoop, Spark, Hive
- Работали со специализированными аналитическими базами данных Greenplum, Vertica, ClickHouse, Teradata
- Разрабатывали процессы обработки сложных событий (CEP) во времени, приближённом к реальному, на Kafka Streams, Spark, Flink
- Руководили стажёрами или начинающими специалистами
- Работали по методологии Agile