Москва
Яндекс Доставка быстро растёт. За несколько лет наша команда запустила удобную доставку в нескольких сотнях городов России и СНГ. Наша цель — стать сервисом доставки по умолчанию для любых задач.
Мы ищем инженера данных, который вместе с аналитиками будет заниматься самыми тяжёлыми расчётами, прорабатывать самые сложные алгоритмы и готовить инструментарий для сотен бизнес-пользователей. У нас вы сможете напрямую влиять на качество логистических продуктов, которыми пользуетесь вы и ваши друзья: от Яндекс Маркета до Яндекс Еды.
Какие задачи вас ждут:
- Работа с данными
Создавать и оптимизировать нетривиальные ETL-процессы обработки данных. Выжимать из сырых данных ценную информацию и аккуратно раскладывать её в удобные для анализа объекты. Работать с данными на всех этапах: от появления информации в источнике до монетизации знаний. - Равитие решений
С командой аналитиков реализовывать стабильный расчёт бизнес-метрик. Поддерживать и изменять решения, отвечать за доступность сервиса и корректность данных, которые он предоставляет.
Мы ждём, что вы
- Отлично знаете Python
- Работаете с Greenplum, Vertica, ClickHouse, Teradata и другими аналитическими базами данных
- Участвовали в проектировании хранилищ данных на любом этапе
Будет плюсом, если вы
- Работали с большими объёмами данных (стек технологий — Hadoop, Spark, Hive)
- Создавали сложные высоконагруженные ETL- и ELT-пайплайны (плюсом будет знание code-driven ETL Luigi, Airflow)
- Разрабатываете процессы обработки сложных событий (CEP) почти в реальном времени (Kafka Streams, Spark, Flink и пр.)
- Работаете с инструментами стека Python для Data Science (Jupyter, pandas, SciPy, Matplotlib, Bokeh и пр.)
- Коммитите в публичные репозитории или пишете статьи с примерами работ