Москва
улица Большая Ордынка 40с7
улица Большая Ордынка 40с7
Мы в Data Office стремимся к централизации экспертизы в области данных и оптимизации ресурсов компании.
Проблемы, которые мы решаем:
-
Аналитики тратят время на поиск данных, создают дублирующие хранилища (тысячи Clickhouse, десятки тысяч Postgres), что приводит к:
- Сложности в поиске релевантных данных и их ответственных.
- Рискам утечки и неконтролируемым копиям.
-
Издатели данных не видят всех потребителей, из-за чего:
- Изменения в данных доходят с опозданием.
- Инциденты с качеством данных обнаруживаются косвенно.
Как мы это делаем:
- Платформа данных — единая точка входа для хранения и потребления аналитических данных компании.
- Политики данных — свод правил по хранению и эксплуатации данных.
- Дата-контракты — чётко фиксируем ответственность издателей и формат отправки данных.
- Data Catalog & Lineage — показываем, какие данные есть, кто ими владеет и как они меняются.
- Тесты качества и мониторинг — следим за инцидентами и уведомляем потребителей.
Данных в компании очень много, поэтому мы ищем кандидатов в отдел Data Governance.
Что нужно делать:
- Сопровождать владельцев данных в подключении их потоков к платформе данных.
- Участвовать в разработке центрального каталога данных.
- Описывать проверки качества данных в соответствии с SLA.
- Принимать участие в разработке фреймворка для работы с качеством данных.
- Строить data-lineage по движению данных внутри и снаружи платформы данных.
- Внедрять data-driven процессы и обучать компанию работать с данными.
- Углубляться в сложные процессы формирования данных.
- Документировать бизнес-смыслы потоков данных.
- Консультировать аналитические команды по использованию данных.
- Проектировать модели данных.
Что мы ждем от кандидата:
- Уверенное знание SQL на уровне написания сложных запросов (оконные функции, функции ранжирования, CTE).
- Опыт работы в data-профессиях (Data Engineer/Data Analyst/DQ Analyst).
- Опыт работы с DWH/Data Lake/Lakehouse.
- Знакомство с принципами проектирования и устройства баз данных (на уровне понимания следующих терминов: нормализация/денормализация, OLAP/OLTP, индексы, ACID).
- Навыки систематизации знаний и документирования.
- Развитые навыки коммуникации.
- Готовность адаптироваться к изменчивой среде.
Преимуществом будет:
- Опыт работы в сфере управления данными/качеством данных.
- Опыт внедрения каталога данных.
- Опыт работы с Trino.
- Знание Python.
- Понимание устройства современных систем обработки BigData.
Условия:
- Гибридный формат работы из офиса в Москве(ул. Большая Ордынка, д.40).
- Работа в сильной и дружной команде.
- Возможность участвовать в сложных и интересных проектах.
- Оформление по ТК РФ в IT компанию.
- Современный стек, минимум бюрократии.
- Бонусы компании: партнерские программы по обучению и фитнесу, корпоративное питание для сотрудников в офисе.