Москва
Требуется ИТ-лидер в команду, которая занимается разработкой и сопровождением витрин данных в банке. Команда 11 человек.
Витрины строятся на базе Arenadata Hadoop (Python, PySpark), источником витрин служат различные слои Озера данных. В дальнейшем витрины используются в Платформе исполнения моделей для принятия решения о выдаче кредитных предложений.
В зоне ответственности будет перечень работ, относящихся к построению, миграции витрин данных, их оптимизации и сопровождению.
Описание задач команды:
- Сбор, анализ, формализация требований
- Подготовка технической документации
- Оценка трудоемкости работ и планирование в рамках проектов ВТБ
- Исследование источников данных
- Составление и доработка маппингов
- Построение прототипов витрин согласно бизнес-требованиям заказчиков
- Проверка качества данных в прототипах
- Постановка задач разработчикам, аналитикам, тестировщикам в команде
- Участие в тестировании и приемке результатов
Обязанности:
- Управление командой, состоящей из аналитиков, разработчиков, тестировщиков
- Соблюдение требований и стандартов производственного процесса банка
- Взаимодействие с руководителями проектов и внутренними заказчиками
- Участие в архитектурных решениях, касающихся построения витрин данных
- Оценка трудозатрат и сроков, декомпозиция задач для команды (на спринт – 2 недели, на супер-спринт – 3 месяца).
- Контроль качества и сроков выполнения задач
- Участие в технической приемке разработанного функционала и взаимодействие с ИБ/внешними подразделениями
Требования:
- Опыт работы с хранилищами данных (DWH), витринами от одного года – факты, снежинки, звезды и т.д.
- Опыт управления командой от одного года
- Знание SQL и Python, плюсом будет опыт работы с Hadoop (Impala/Hive)
- Знания в области Big Data (Hadoop, Spark) и опыт работы с базами данных
- Опыт работы с технической документацией
- Опыт работы с выстраиванием качества данных
- Умение профилировать источники данных, выявлять закономерности
- Умение планировать и оценивать задачи команды
- Понимание гибких методологий разработки (Agile)
- Понимание принципов CI/CD, Gitflow, управления релизами
Желательно:
- Знание планировщиков процессов (AirFlow)
- Опыт разработки и/или внедрения витрин
- Понимание способов интеграций IT-систем
Стек: Python, PySpark, Hadoop, Apache Spark, AirFlow, Kafka