Аналитик-детектив данных в тревел

Дата размещения вакансии: 28.11.2024
Работодатель: Туту.ру
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 1 года до 3 лет

Привет! Мы команда Туту. У нас сервис путешествий, мы каждый день отправляем флот самолётов, несколько поездов и много автобусов. В компании 790 человек, из них около 300 — ИТ.

С учётом количества людей, у нас много команд меняются данными через инфраструктурную платформу. Есть команда, которая делает эту инфраструктуру и инструменты. Инструменты они отдают в продуктовые команды и говорят: “вот вам молоток, пользуйтесь". Продуктовые команды берут инструменты и начинают ими пользуются. Иногда мы на это смотрим и плачем, потому что молотком очень тяжело закручивать шурупы. А данным в результате нельзя верить местами, потому что где-то команда не следит за багами, где-то не понимает, чья зонаответственности и так далее.

Собственно, вам предстоит войти в новую команду качества данных, которая будет помогать всё это держать в порядке. Это что-то вроде третьей линии поддержки по данным.

Задач бывает два типа:

— Хорошие, когда заранее понятно, что сделать. Вы с бизнесом определяете требования к качеству данных, дальше всё это собирается. Например, если с 4 продуктов надо собрать данные о продажах, вы помогаете организовать эти 4 потока и настраиваете проверки, и убеждаетесь, что до каждого потока доезжает всё нужное.

— Поинтереснее, когда уже что-то сделали, аналитик делает задачу, а в данных вдруг сюрприз. Причём от кого этот сюрприз и в чьей зоне ответственности — непонятно. В этом месте вы становитесь детективом и начинаете по логам выслеживать, что же портит данные. А потом описываете проблему и передаете в команду, которая будет её решать. Ведёте задачу до починки менеджер процесса в службе качества.

Если нет текущих инцидентов и новых проектов, есть время делать дашборды и внутренние инструменты слежения за качеством потоков.

Стек

— SQL, REST, Confluence, Jira, Miro.

— Хранилища, используемые в компании: ClickHouse, PostgreSQL, MySQL, ElasticSearch, MongoDb.

— Шина данных на основе Kafka.

— В качестве BI-инструмента для бизнес-пользователей используется Metabase.

— Для визуализации и работы с техническими метриками и логами используем Grafana + Kibana.

— Данные порождаются в 1000+ сервисах и в монолите, которые работают в нашем внутреннем облаке на OpenShift или на docker-хостах.

От вас нужно

— Опыт работы в роли, требующей работы с большими объёмами данных на схожем стеке от 1 года в любой сфере.

— Знание SQL (предпочтительно ClickHouse).

— Python на уровне работы с Dataframe Pandas и построение визуализаций в Plotly.

— Опыт работы с BI-инструментом (любой).

— Опыт презентации результатов работы и визуализации результатов.

— Умение мыслить и находить в большом объёме неструктурированной информации зависимости и закономерности.

— Готовность освоить новые инструменты:

BI: Grafana, Metabase, Kibana.

Написание запросов к хранилищам: Elasticsearch, MongoDB, Prometheus, MariaDB, PostgreSQL.

Про команду и рабочий процесс

Команда новая и только собирается. Сейчас в команде два человека: руководитель и владелец процесса работы с инцидентами.

Задачи предварительно формулируются руководителем/владельцем процессов или приходят от пользователей через задачи в Jira. Планируются спринты, проводится уточнение требований и деталей, важных для оценки задачи, у постановщика и заказчика.

Набор проектов/больших целей фиксируется на квартал, бьётся на спринты, планы по спринтам обсуждаются раз в неделю.

По задачам, которые попали в спринт: пишется план по задачам, обсуждаются с командой, а выводы фиксируются в Confluence и обсуждаются с командой при необходимости. На текущей стадии происходит взаимодействие и с аналитиками данных, которые пользуются данными, и с разработчиками команд.

15–30-минутные стендапы каждый день, ретро по проектам или большим задачам. Задачи проходят review, если это код/дашборд или решение на более чем полгода. Проводим демо, если было что-то важное для более чем двух пользователей данных/заказчиков.

График работы

Есть полная удалёнка, работа из офиса или посещение офиса когда захочется. Это как вам удобнее.

Про компанию

— Компания с хорошим техническим стеком, техруководителями и готовностью одними из первых пробовать новые технологии.

— Сильный блог на Хабре, где пишут в том числе технари о своей работе.

— Хорошая техническая инфраструктура, очень крутая внутренняя база знаний, культура API и так далее.

— Открываются новые направления, где можно делать всё с нуля.

Весь положенный набор плюшек: ДМС со стоматологией, кухня в офисе, страховка на путешествия, ноутбук, премии по результатам работы, оплата больничных, регулярная переиндексация зарплаты, а также обучение, премия за прочитанные книги и обмен опытом.

Структура собеседований

— Пройти HR-менеджера, 30–40 минут. Никаких «кем вы видите себя через 5 лет».

— Встреча с парой техспецов. Можно понять, достаточно ли профессиональна наша команда и комфортно ли вам с ней будет. Мы в свою очередь проверим ваши профессиональные знания и навыки ;)

— Финальная встреча с командой и её руководителем.