улица Грузинский Вал 7
Команда занимается улучшением работы аналитиков в платформе данных. Анализируем, как работает наше хранилище, ищем способы ускорить запросы, сократить число ошибок, улучшить инструменты (DLH, Greenplum, Proteus и пр).
В частности, курируем миграцию на новое хранилище даных DLH и работу в нем. Поэтому много новых задач, связанных с этой миграцией, и в рамках данной вакансии планируем найти сотрудника на задачи :
анализа оптимальности запросов, преобразования кода Greenplum -> Trino|Spark
управления вычислительным ресурсом (выделение ресурсов под бизнес-линию, рассадка по кластерам и пр)
создание дашбордов с визуализацией по оптимальности и утилизации ресурса
разбора сложных сценариев и выработки практик работы в хранилище данных (как для пользователей, так и для инструментов).
Требования:
- Высокий уровень SQL (в частности, оптимизация запросов);
- Опыт визуализации в Apache Superset, Tableau или аналогичных средах;
- Хорошее знание Python для работы с данными;
- Умение работать с Git-ом
- Spark, Trino, ML, Grafana - как преимущество
Обязанности:
Общий стрим заключается в миграции пользовательских процессов из одной среды (greenplum) в другую (trino/spark), а также ряд связанных с этим задач:
- разбор пользовательских сценариев аналиков (что-делают зачем, что мешает переехать, какие ошибки могут возникнуть в переезде и как их решить - на уровне изменения кода/логики процесса;
- аналитика хода работ, выбор приоритетных вариантов переезда, предложения по доработке платформы;
- визуализация хода процесса и итогов работ.