Привет! Мы команда Туту. У нас сервис путешествий, мы каждый день отправляем флот самолётов, несколько поездов и много автобусов. В компании 790 человек, из них около 300 — ИТ.
С учётом количества людей, у нас много команд меняются данными через инфраструктурную платформу. Есть команда, которая делает эту инфраструктуру и инструменты. Инструменты они отдают в продуктовые команды и говорят: “вот вам молоток, пользуйтесь". Продуктовые команды берут инструменты и начинают ими пользуются. Иногда мы на это смотрим и плачем, потому что молотком очень тяжело закручивать шурупы. А данным в результате нельзя верить местами, потому что где-то команда не следит за багами, где-то не понимает, чья зонаответственности и так далее.
Собственно, вам предстоит войти в новую команду качества данных, которая будет помогать всё это держать в порядке. Это что-то вроде третьей линии поддержки по данным.
Задач бывает два типа:
— Хорошие, когда заранее понятно, что сделать. Вы с бизнесом определяете требования к качеству данных, дальше всё это собирается. Например, если с 4 продуктов надо собрать данные о продажах, вы помогаете организовать эти 4 потока и настраиваете проверки, и убеждаетесь, что до каждого потока доезжает всё нужное.
— Поинтереснее, когда уже что-то сделали, аналитик делает задачу, а в данных вдруг сюрприз. Причём от кого этот сюрприз и в чьей зоне ответственности — непонятно. В этом месте вы становитесь детективом и начинаете по логам выслеживать, что же портит данные. А потом описываете проблему и передаете в команду, которая будет её решать. Ведёте задачу до починки менеджер процесса в службе качества.
Если нет текущих инцидентов и новых проектов, есть время делать дашборды и внутренние инструменты слежения за качеством потоков.
Стек
— SQL, REST, Confluence, Jira, Miro.
— Хранилища, используемые в компании: ClickHouse, PostgreSQL, MySQL, ElasticSearch, MongoDb.
— Шина данных на основе Kafka.
— В качестве BI-инструмента для бизнес-пользователей используется Metabase.
— Для визуализации и работы с техническими метриками и логами используем Grafana + Kibana.
— Данные порождаются в 1000+ сервисах и в монолите, которые работают в нашем внутреннем облаке на OpenShift или на docker-хостах.
От вас нужно
— Опыт работы в роли, требующей работы с большими объёмами данных на схожем стеке от 1 года в любой сфере.
— Знание SQL (предпочтительно ClickHouse).
— Python на уровне работы с Dataframe Pandas и построение визуализаций в Plotly.
— Опыт работы с BI-инструментом (любой).
— Опыт презентации результатов работы и визуализации результатов.
— Умение мыслить и находить в большом объёме неструктурированной информации зависимости и закономерности.
— Готовность освоить новые инструменты:
BI: Grafana, Metabase, Kibana.
Написание запросов к хранилищам: Elasticsearch, MongoDB, Prometheus, MariaDB, PostgreSQL.
Про команду и рабочий процесс
Команда новая и только собирается. Сейчас в команде два человека: руководитель и владелец процесса работы с инцидентами.
Задачи предварительно формулируются руководителем/владельцем процессов или приходят от пользователей через задачи в Jira. Планируются спринты, проводится уточнение требований и деталей, важных для оценки задачи, у постановщика и заказчика.
Набор проектов/больших целей фиксируется на квартал, бьётся на спринты, планы по спринтам обсуждаются раз в неделю.
По задачам, которые попали в спринт: пишется план по задачам, обсуждаются с командой, а выводы фиксируются в Confluence и обсуждаются с командой при необходимости. На текущей стадии происходит взаимодействие и с аналитиками данных, которые пользуются данными, и с разработчиками команд.
15–30-минутные стендапы каждый день, ретро по проектам или большим задачам. Задачи проходят review, если это код/дашборд или решение на более чем полгода. Проводим демо, если было что-то важное для более чем двух пользователей данных/заказчиков.
График работы
Есть полная удалёнка, работа из офиса или посещение офиса когда захочется. Это как вам удобнее.
Про компанию
— Компания с хорошим техническим стеком, техруководителями и готовностью одними из первых пробовать новые технологии.
— Сильный блог на Хабре, где пишут в том числе технари о своей работе.
— Хорошая техническая инфраструктура, очень крутая внутренняя база знаний, культура API и так далее.
— Открываются новые направления, где можно делать всё с нуля.
Весь положенный набор плюшек: ДМС со стоматологией, кухня в офисе, страховка на путешествия, ноутбук, премии по результатам работы, оплата больничных, регулярная переиндексация зарплаты, а также обучение, премия за прочитанные книги и обмен опытом.
Структура собеседований
— Пройти HR-менеджера, 30–40 минут. Никаких «кем вы видите себя через 5 лет».
— Встреча с парой техспецов. Можно понять, достаточно ли профессиональна наша команда и комфортно ли вам с ней будет. Мы в свою очередь проверим ваши профессиональные знания и навыки ;)
— Финальная встреча с командой и её руководителем.