В Финтехе мы создаём платёжные продукты, сервисы и инструменты для управления личными финансами. Финтех уже превратился из стартапа в полноценный и крайне важный продукт.
Прямо сейчас мы собираем новое — аналитическое — хранилище данных и формируем для этого команду. В хранилище нет легаси, поэтому у вас будет возможность оказаться у истоков нового проекта. У нас большие планы — приходите помогать их реализовать!
Какие задачи вас ждут:
- Построение ETL-процессов
Нужно извлекать из источников ценную информацию, обрабатывать её и приводить к виду, достойному взору аналитиков. Сложность пайплайнов может варьироваться от простых инжестов данных из внешней среды и приземления результата в хранилище до витиеватых графов со множеством инпутов и аутпутов.
- Оптимизация логики
Как известно, у нас нет собственного легаси, но мы часто работаем с прототипами, реализованными аналитиками, чьё представление о прекрасном может не совпадать с нашим. Поэтому мы распутываем нетривиальную логику и предлагаем более строгую, консистентную и оптимальную, ориентируясь на большие объёмы данных.
- Обеспечение доступности сервиса
Олимпиадный подход подразумевает одноразовость результата. Мы преследуем совсем другие цели, поэтому максима «сработало раз — и ладно» не о нас. Идеал такой: хранилище обеспечивает регулярную поставку с минимально возможным количеством сбоев, а данные — корректны, полны, непротиворечивы и отвечают самым строгим стандартам качества.
- Проектирование структуры хранилища
Лучшее аналитическое DWH ещё только в планах. Мы хотим заложить основы, которые позволят ему быстро развиваться, обрастая при этом не костылями и велосипедами, а современными инженерными практиками и подходами.
- Взаимодействие с аналитиками
Они наши главные и любимые заказчики. Вместе с ними вам предстоит обдумывать бизнес-задачи, иногда спорить, но в итоге — находить оптимальные решения. Неотъемлемой частью этого процесса всегда будет накапливание личного опыта в бизнес-домене Финтеха. Прибавим сюда рост инженерного опыта — и получим двойную выгоду. Почти как у Яндекс Пэй.
Мы ждем, что вы:
- Уверенно программируете на Python;
- Хорошо знаете SQL и понимаете устройство современных СУБД;
- Понимаете и можете объяснить необходимость непрерывной интеграции и доставки (CI/CD), преимущества использования систем контроля версий, код-ревью, тестирования и мониторинга;
- Работаете в командной строке Unix-подобных систем (Linux, macOS).
Будет плюсом, если вы:
- Создавали сложные высоконагруженные ETL- и ELT-процессы (Hadoop, Hive, Spark);
- Разрабатывали процессы обработки событий, приближенные к реальному времени (Kafka, Spark Streaming, Flink);
- Знакомы со специализированными аналитическими БД (Greenplum, Vertica, ClickHouse, Teradata) и аналитическими инструментами на базе Python (Jupyter, pandas, SciPy, Matplotlib);
- Участвовали в проектировании хранилищ данных;
- Работали по методологии Agile;
- Руководили стажёрами или начинающими специалистами;
- Публикуете свой код в доступном репозитории, пишете статьи, выступаете на конференциях.