з/п не указана
Москва
Бумажный 19 стр 1
Бумажный 19 стр 1
От 3 до 6 лет
Чем тебе придется заниматься
- Разрабатывать ML/DL модели для задач RecSys, uplift-моделирования
- Участвовать в code review и архитектурных обсуждениях для повышения качества кода команды
- Готовить и анализировать данные: работать с большими массивами в S3 через Spark/PySpark, выполнять агрегацию, очистку и трансформацию
- Проводить исследовательский анализ данных (EDA) для выявления паттернов, аномалий и дисбалансов.
- Валидировать и тестировать модели: сравнивать алгоритмы через A/B тесты и backtesting, оценивать эффект от внедрения
- Документировать эксперименты, логику моделей, признаки и ограничения для обеспечения воспроизводимости
- Подготавливать код к продакшену: обеспечивать чистоту, логирование и надежность решений
Мы ожидаем
- Опыт коммерческой работы в ML/Data Science от 2 лет
- Знание алгоритмов машинного и глубокого обучения (recsys, uplift, классические задачи)
- Навык работы с Python и основным стеком библиотек (scikit-learn, градиентный бустинг, PyTorch)
- Опыт обработки больших данных: подготовка признаков и анализ через SQL и PySpark
- Понимание метрик качества моделей и методов их оценки
- Знание статистики и принципов проведения A/B-тестов
- Представление о полном жизненном цикле ML-моделей (от идеи до продакшена)
- Инженерные навыки: уверенное владение Git, MLFlow, умение писать чистый и поддерживаемый код
Будет плюсом
- Опыт проработки новых ML-инициатив «с нуля»: от оценки данных до подготовки design doc
- Готовность участвовать в скоупинге проектов, формулировании гипотез и требований к валидации