Data Engineer

Дата размещения вакансии: 08.04.2025
Работодатель: РСХБ-Интех
Уровень зарплаты:
з/п не указана
Город:
Москва
Пресненская набережная 10с2
Требуемый опыт работы:
От 1 года до 3 лет

РСХБ-Интех — аккредитованная IT-компания. Мы разрабатываем новые банковские продукты Россельхозбанка и улучшаем текущие. Наши сервисы помогают миллионам клиентов удалённо пользоваться банковскими услугами, оформлять карты, брать кредиты и инвестировать. Мы даём возможность агропредпринимателям продавать и покупать сельскохозяйственные товары онлайн, а малому и крупному бизнесу — вести финансовые дела в надёжном и удобном онлайн-пространстве.

Лаборатория искусственного интеллекта - это новый отдел, основной задачей которого является внедрение технологий ИИ в бизнес-процессы банка. Мы развиваем свою MLOps платформу (Kubernetes, JupyterHub, AirFlow, MLflow и т.д.) под названием RAISA и делаем на ней инструменты и фреймворки как для себя, так и для других дата-специалистов РСХБ и РСХБ-Интех. Мы ищем самостоятельных и инициативных специалистов, готовых вести разработку и внедрение процессов (от аналитических отчетов и ETL до построения ML моделей) в Лаборатории с нуля.

Сейчас в связи с активным расширением нам нужен Инженер данных.

Обязанности:

  • Проектирование и разработка ETL-потоков, витрин данных, отчетов;
  • Очистка и стандартизация сырых данных, разработка проверок качества данных;
  • Разработка алгоритмов, обрабатывающих большое количество файлов с данными (xlsx, xml, csv);
  • Интеграция аналитического хранилища с другими автоматизированными системами банка;
  • Оптимизация и автоматизация процессов работы с данными;
  • Проектирование архитектуры решений для реализации бизнес-требований;
  • Сопровождение существующей функциональности дата-платформы;
  • Анализ и мониторинг производительности;
  • Внедрение современных практик и инженерных подходов;
  • Регулярное взаимодействие с бизнесом по задачам с целью уточнить требования.

Требования:

  • Продвинутые знания теории БД, SQL (PostgreSQL, PL/SQL), Python 3.8+, AirFlow;
  • Знание Python-библиотек для работы обработки данных (Pandas/Dask/PySpark, Numpy) и визуализации (Matplotlib/Seaborn/Plotly);
  • Навыки работы с Jupyter (notebook, lab, hub) ;
  • Опыт работы с большим количеством файлов с данными (xlsx, xml, csv);
  • Опыт работы с BI-инструментами;
  • Основные команды Git, базовое понимание CI/CD;
  • Знания различных типов архитектуры хранилищ, ETL/ELT-инструментов и принципов работы с данными;
  • Умение покрывать код и артефакты разработки документацией;
  • Английский, достаточный для чтения и понимания документации.

Будет плюсом:

  • ​​​​​​​Опыт работы с распределенными хранилищами данных (Greenplum, Clickhouse, Hadoop);
  • Понимание принципов контейнеризации, базовые знания Docker/Kubernetes.

Условия:

​​​​​​​​​​​

  • Обучение за счет компании (посещение конференций, курсов, помощь в написании статей на Хабр и т.д.);
  • Вертикальное и горизонтальное развитие: регулярные тренинги, вебинары, митапы;
  • Забота о вашем здоровье: ДМС после испытательного срока, куда входит стоматология;
  • Прозрачный доход: оклад (по итогам интервью) + ежеквартальные премии по результатам KPI;
  • Гибкий график или полная удаленка (по итогам общения с командой);
  • Комфортные и современные офисы в городах присутствия (Москва, Санкт-Петербург, Уфа, Новосибирск, Белгород и т.д.);
  • Дополнительные бонусы от Россельхозбанка для сотрудников группы компаний (Скидки на спортзалы, рестораны, маркетплейсы и т.д.).