проспект Мангилик Ел 55/18
Обязанности:
-
Сбор и подготовка данных: извлечение, очистка, интеграция, контроль качества.
-
Работа с БД: проектирование и оптимизация реляционных (PostgreSQL, MySQL) и OLAP-баз (ClickHouse), настройка в облаке GCP.
-
ETL и обработка: разработка и автоматизация процессов (Airflow, Docker, GCP), поддержка DAG-ов, мониторинг и алерты.
-
Аналитика: EDA, поиск паттернов, статистический анализ, сегментация, ad-hoc и post-launch аналитика.
-
Бизнес-аналитика: анализ ключевых метрик, построение бизнес-кейсов, прогнозирование влияния изменений на продуктовые показатели.
-
Отчётность и визуализация: создание витрин данных, дашбордов (Power BI, Tableau, Matplotlib, Plotly), автоматизация отчётности, презентация результатов.
- ML и моделирование: разработка и прототипирование моделей (включая NLP и BERT), построение предиктивных моделей.
Требования:
-
Опыт: 3+ года в проектах, связанных с данными (BI, DWH, аналитика, трансформация, governance).
-
Образование: высшее техническое (математика, информатика, статистика, экономика, инженерные специальности).
-
Языки и инструменты: Python (pandas, numpy, scikit-learn, TensorFlow/PyTorch), продвинутый SQL (joins, агрегации, оконные функции), Git, Linux, CI/CD.
-
Базы и инфраструктура: PostgreSQL, MySQL, ClickHouse, Oracle/Hive; понимание OLTP/OLAP, архитектур Data Lake / Data Warehouse; опыт с GCP/Azure; Docker, Airflow.
-
ML и DS: опыт обучения и внедрения моделей (NLP, CV, рекомендательные системы), работа с Transformers (BERT), знание ML-фундаментов и статистики.
-
Data Governance и процессы: опыт data profiling, анализа качества данных, source-to-target мэппингов; работа по Agile/Waterfall.
-
Визуализация: опыт с BI-инструментами (Power BI, Tableau, Looker), Excel/Google Sheets (сводные, формулы, макросы).
- Soft skills: аналитическое мышление, умение формализовать требования и доносить результаты бизнесу простым языком.