Инженер данных в Финтех

Дата размещения вакансии: 27.12.2024
Работодатель: Яндекс
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

В Финтехе мы создаём платёжные продукты, сервисы и инструменты для управления личными финансами. Финтех уже превратился из стартапа в полноценный и крайне важный продукт.

Прямо сейчас мы собираем новое — аналитическое — хранилище данных и формируем для этого команду. В хранилище нет легаси, поэтому у вас будет возможность оказаться у истоков нового проекта. У нас большие планы — приходите помогать их реализовать!

Какие задачи вас ждут:

  • Построение ETL-процессов

Нужно извлекать из источников ценную информацию, обрабатывать её и приводить к виду, достойному взору аналитиков. Сложность пайплайнов может варьироваться от простых инжестов данных из внешней среды и приземления результата в хранилище до витиеватых графов со множеством инпутов и аутпутов.

  • Оптимизация логики

Как известно, у нас нет собственного легаси, но мы часто работаем с прототипами, реализованными аналитиками, чьё представление о прекрасном может не совпадать с нашим. Поэтому мы распутываем нетривиальную логику и предлагаем более строгую, консистентную и оптимальную, ориентируясь на большие объёмы данных.

  • Обеспечение доступности сервиса

Олимпиадный подход подразумевает одноразовость результата. Мы преследуем совсем другие цели, поэтому максима «сработало раз — и ладно» не о нас. Идеал такой: хранилище обеспечивает регулярную поставку с минимально возможным количеством сбоев, а данные — корректны, полны, непротиворечивы и отвечают самым строгим стандартам качества.

  • Проектирование структуры хранилища

Лучшее аналитическое DWH ещё только в планах. Мы хотим заложить основы, которые позволят ему быстро развиваться, обрастая при этом не костылями и велосипедами, а современными инженерными практиками и подходами.

  • Взаимодействие с аналитиками

Они наши главные и любимые заказчики. Вместе с ними вам предстоит обдумывать бизнес-задачи, иногда спорить, но в итоге — находить оптимальные решения. Неотъемлемой частью этого процесса всегда будет накапливание личного опыта в бизнес-домене Финтеха. Прибавим сюда рост инженерного опыта — и получим двойную выгоду. Почти как у Яндекс Пэй.

Мы ждем, что вы:

  • Уверенно программируете на Python;
  • Хорошо знаете SQL и понимаете устройство современных СУБД;
  • Понимаете и можете объяснить необходимость непрерывной интеграции и доставки (CI/CD), преимущества использования систем контроля версий, код-ревью, тестирования и мониторинга;
  • Работаете в командной строке Unix-подобных систем (Linux, macOS).

Будет плюсом, если вы:

  • Создавали сложные высоконагруженные ETL- и ELT-процессы (Hadoop, Hive, Spark);
  • Разрабатывали процессы обработки событий, приближенные к реальному времени (Kafka, Spark Streaming, Flink);
  • Знакомы со специализированными аналитическими БД (Greenplum, Vertica, ClickHouse, Teradata) и аналитическими инструментами на базе Python (Jupyter, pandas, SciPy, Matplotlib);
  • Участвовали в проектировании хранилищ данных;
  • Работали по методологии Agile;
  • Руководили стажёрами или начинающими специалистами;
  • Публикуете свой код в доступном репозитории, пишете статьи, выступаете на конференциях.