Москва
Яндекс Доставка — молодой сервис для людей и для бизнеса. Мы используем свой опыт в IT, чтобы делать новую доставку — быструю, дружелюбную и гибкую. Наш продукт лежит на стыке онлайна и офлайна: человек нажал на кнопку — курьер выехал. Мы мало работаем с абстракциями и много — с живым человеческим опытом. Мы уже лидеры на рынке экспресс-доставки, а следующая наша большая цель — создать доставку к любому точному времени из одного или нескольких магазинов, одному или нескольким клиентам. Чтобы всё получилось, нам нужна сильная аналитика, основанная на точных и своевременных данных в DWH.
Какие задачи вас ждут
- собирать и анализировать требования в части аналитических отчётов, дашбордов, механизмов и выгрузок;
- проверять новые требования на согласованность с уже существующими требованиями к хранилищу, находить противоречия, предлагать решения в спорных ситуациях;
- проектировать объекты хранилища и монтировать их в общую модель;
- проверять полученные витрины и отчёты на соответствие требованиям;
- описывать артефакты задачи в базе знаний: дополнять глоссарий, визуализировать сложные решения в виде схем и моделей;
- быть активным и бдительным, транслировать проработанные требования разработчикам, управлять ожиданиями заказчиков, видеть узкие места и риски на пути к достижению результата.
Мы ждем, что вы
- участвовали в проектах развития хранилищ данных;
- умеете выявлять и декомпозировать требования, относящиеся к бизнес-пользователям;
- внимательно ставите задачи разработчикам;
- понимаете схемы Data Vault, Anchor Modeling, «звезда», OLAP-кубов, их плюсы и минусы, паттерны использования;
- имеете знания в области теории баз данных;
- знаете SQL на уровне родного языка;
- общительны и дружелюбны.
Будет плюсом, если вы
- анализируете (а лучше пишете) код на Python;
- работаете в Agile-команде и можете объяснить, почему это лучше, чем Waterfall (или хуже);
- умеете тестировать ETL-процессы и профилировать данные;
- работаете со специализированными аналитическими базами данных (Greenplum, Vertica, ClickHouse, Teradata и пр.);
- работаете с инструментами стека Python для data science (Jupyter, Pandas, SciPy, Matplotlib, Bokeh и пр.);
- коммитите в публичные репозитории или пишете статьи с примерами работ.