улица Льва Толстого
Мы — команда разработки финансового DWH (хранилища данных) в Яндекс Рекламе. Ищем опытного разработчика для создания новых и поддержания текущих пайплайнов и инструментов обработки данных.
Наши данные помогают бизнесу и продуктовым командам принимать решения, оценивать эффективность и маржинальность крупнейших проектов Яндекса.
Какие задачи вас ждут:
Проектирование и поддержка пайплайнов
Вы будете проектировать и реализовывать новые пайплайны подготовки финансовых данных, а также модернизировать текущие. В мире развивающихся продуктов DWH должно постоянно поддерживать актуальные наборы данных, отражающих текущую эффективность продукта в единых терминах для совершенно разных потребителей.
Внедрение новинок и экономия ресурсов
Вам нужно будет анализировать и улучшать техническую составляющую контура. Объём данных растёт быстрее, чем количество железа, на котором их можно обработать, так что задача рефакторинга и внедрения лучших технологий для экономии вычислительных мощностей и эффективного использования систем хранения стоит постоянно.
Аналитика и процессы Data Quality
Аналитика со стороны DWH — первая точка в процессе поддержания продуктовых смыслов: от сырых логов до отчётных дашбордов и витрин. Поэтому вам важно хорошо разбираться в доменной области и всех нюансах. Также для наших данных критично постоянно развивать процессы Data Quality и при этом искать баланс между полнотой и эффективностью.
Мы ждем, что вы:
- Уверенно программируете на Python и знакомы с SQL
- Знаете базовые алгоритмы и структуры данных
- Знакомы с парадигмой MapReduce
- Умеете погружаться в данные, находить, как разные источники соотносятся друг с другом
Будет плюсом, если вы:
- Знаете нюансы потоковой и пакетной обработки данных
- Имеете опыт в создании мониторингов качества данных