Senior Data Scientist в команду предиктивной аналитики

Дата размещения вакансии: 06.05.2025
Работодатель: VK
Уровень зарплаты:
з/п не указана
Город:
Москва
Садовническая улица 82с2
Требуемый опыт работы:
От 3 до 6 лет

Мы создаём самую большую рекомендательную систему в России, выпускаем приложения под Android и iOS, разрабатываем редактор видео и помогаем интересным блогерам найти новую аудиторию, а пользователям — интересные публикации. За этим стоят сложные алгоритмы, сотни тестов и сервис, который обрабатывает 150 тысяч запросов в секунду.

О проекте

Команда предиктивной аналитики управляет контентом, обогащая его дополнительной информацией за счёт ML-моделей, краудсорсинга, LLM. Мы являемся центром экспертизы по автоматизированной разметке, за счёт которой работают рекомендации, поиск, модерация и антифрод. Именно наша команда строит ML-модели и предоставляет предиктивную аналитику по контенту и профилям для бизнес-юнитов холдинга. Для этого мы выстраиваем end-to-end пайплайны обработки и дистрибуции данных, обучаем и используем как классические ML-модели, так и LLM (LLaMa, ChatGPT и другие). Так как всё большему количеству бизнес-юнитов требуется наша экспертиза, мы ищем Senior Data Scientist с опытом вывода ML-моделей в прод.

Задачи

  • Построение и улучшение ML-архитектуры процессов обработки данных

  • Разработка ML-моделей, настраивание их качественной и количественной оценки, анализ результатов

  • Работа с инструментами разметки (LLM и краудсорсинг) для подготовки Ground Truth данных

  • Взаимодействие с заказчиками, груминги, декомпозиция крупных ML-проектов

Требования

  • Высшее техническое или математическое образование

  • Более двух лет опыта на позиции Data Science или Machine Learning

  • Опыт работы с Python (Pandas, NumPy, SciPy, CatBoost, XGBoost), SQL (оконки, процедуры) — для подготовки данных и обучения ML-моделей

  • Опыт работы с системами краудсорсинга (например, Толока) для получения разметки в целях мониторинга, обучения, улучшения моделей

  • Опыт работы с Airflow, BI-системами — Datalens/Superset/Tableu/Power-BI

  • Опыт вывода в прод классических ML-моделей (например, бустингов)

  • Умение работать с математической статистикой для управления статзначимостью метрик моделей и пайплайнов

  • Будет плюсом опыт работы с LLM-моделями