Санкт-Петербург
11-я Красноармейская улица 18-20
11-я Красноармейская улица 18-20
Обязанности:
- Анализ данных для ML- и LLM-проектов (например: прогнозирование спроса, сегментация клиентов, автоматизация обработки текстов).
- Подготовка фичей и создание экспериментальных витрин на основе слоёв Gold/Platinum Data Lake House (совместно с Data Engineers и Data Scientists).
- Разработка и проверка бизнес-гипотез, формирование запросов к данным.
- Анализ результатов моделей, построение отчётов и визуализаций для бизнеса (Power BI, ClickHouse, Python-визуализации).
- Оценка качества данных (data quality), проведение контрольных проверок.
- Участие в процессе feature engineering: выбор признаков, обработка аномалий, подготовка агрегатов.
- Взаимодействие с командами ML, LLM и Data Engineering для поддержки end-to-end пайплайнов.
- Подготовка документации и аналитических записок для бизнес-подразделений.
Требования:
- Опыт работы аналитиком данных или AI Data Analyst — от 3 лет.
- Отличное знание SQL (в том числе сложных аналитических запросов, оконных функций).
- Уверенное владение Python (Pandas, NumPy, Matplotlib/Seaborn или Plotly).
- Опыт подготовки и анализа данных для ML/LLM задач.
- Понимание архитектуры Data Lake / Data Lake House, слоёв Gold/Platinum.
- Навыки построения витрин данных и визуализаций.
- Опыт взаимодействия с бизнес-пользователями, умение формулировать и проверять гипотезы.
-
GIT, GIT LAB, Airflow, Jupyter Notebook/Jupyter Lab/Datalore.
Будет плюсом:
- Опыт работы с BI-инструментами (Power BI, Tableau/DataLens/Redash).
- Знание подходов feature engineering и основ ML (без глубокого моделирования).
- Понимание data governance (качество данных, data lineage).
-
Опыт работы с объектными хранилищами (S3) и распределёнными системами (Spark).