Обязанности:
Анализируем данные:
- для легаси-процессов запрашиваем данные из хранилищ (Oracle/PostgreSQL), предобрабатываем и импортируем в наши локальные витрины (CH)
- новые отчёты строим на основе внешних CH витрин напрямую на удалённом кластере
- обрабатываем, агрегируем и анализируем собранные данные при помощи Python (SQLAlchemy, Pandas & NumPy)
- визуализируем результаты: Seaborn, Excel, Datalens, есть своя BI-система ДЗМ
- исполняем как ad hoc запросы, так и регулярный анализ (AirFlow), автоматически отправляем результаты по желаемым каналам связи (email, Telegram, NextCloud)
- обслуживаем аналитическую инфраструктуру (выстраиваем ETL-процессы (AirFlow, SystemCTL), поддерживаем локальную БД (ClickHouse)
Требования:
- уверенное владение Python (обязательно: опыт написания классов, умение разбираться в чужом (особенно легаси) коде, пакеты pandas, requests, sqlalchemy, включая встроенные модули os и shutil
- уверенное знание SQL (обязательно: умение использовать агрегатные функции, CTE, вложенные запросы, функции преобразования типов и работы со строками, умение разбираться в незнакомых и грязных данных, искать аномалии в данных – дубли, некорректные значения
- базовый Excel
желательно: опыт работы с колоночными СУБД (clickhouse), опыт создания таблиц, администрирования БД
Условия:
- офис в шаговой доступности м. Новослободская
- заработная плата обсуждается с успешным кандидатом+премии
- социально-значимые проекты в здравоохранении
- карьерный рост
- обучающие корпоративные программы
- кофе, чай, печеньки в офисе