В команду «Гео и Графы» Корпоративного блока Сбербанка мы ищем специалистов по работе с данными. Вам предстоит работать с источниками и витринами данных различных банковских систем, строить витрины данных, использующиеся для построения моделей и автоматизации Графа связанности Юрлиц.
Обязанности
Исследование источников данных
* Подготовка прототипов витрин, создание алгоритмов загрузки данных в витрины
* Обеспечения сбора и организация процесса загрузки данных в аналитические системы, включая получение структурированных и не структурированных данных из различных источников, подготовку, очистку и предобработку данных из внешних источников, построение агрегатов
* Написание функций и хранимых процедур для преобразования и агрегации данных
* Настройка первичной обработки данных от источников (очистка, обогащение и т.д.)
* Управление качеством данных
* Разработка новых витрин/объектов исходя из требований заказчиков
Требования
* Опыт работы по направлению от 2 лет
* Хорошее знание SQL: индексы и их применение, написание хранимых процедур, создание витрин (желателен опыт оптимизации)
* Python, знание стандартных структур данных python
* Понимание процессов ETL, ELT
Как преимущество
* Знание Spark, PySpark, особенности написания кода для стека Hadoop, Spark, использование UDF
* Знание особенностей программирования в распределённых системах
* Опыт работы с noSql базами
- комфортный современный офис рядом с м. Кутузовский проспект, формат работы - гибрид
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.