Руководитель команды Data Science в AI VK

Дата размещения вакансии: 02.12.2024
Работодатель: VK
Уровень зарплаты:
з/п не указана
Город:
Москва
Садовническая улица 82с2
Требуемый опыт работы:
От 3 до 6 лет
Мы создаём самую большую рекомендательную систему в России, выпускаем приложения под Android и iOS, разрабатываем редактор видео и помогаем интересным блогерам найти новую аудиторию, а пользователям — интересные публикации. За этим стоят сложные алгоритмы, сотни тестов и сервис, который обрабатывает 150 тысяч запросов в секунду.

О проекте

Команда предиктивной аналитики управляет контентом, обогащая его дополнительной информацией за счет ML-моделей, краудсорсинга, LLM. Мы являемся центром экспертизы по автоматизированной разметке, за счёт которой работают рекомендации, поиск, модерация и антифрод. Именно наша команда строит ML-модели и предоставляет предиктивную аналитику по контенту и профилям для бизнес-юнитов холдинга. Для этого мы выстраиваем end-to-end пайплайны обработки и дистрибуции данных, обучаем и используем как классические ML-модели, так и LLM.
Так как всё большему количеству бизнес-юнитов требуется наша экспертиза, мы ищем руководителя команды предиктивной аналитики — играющего тренера, который возглавит одну из вертикалей предиктивной аналитики, сможет усилить data science команду своей экспертизой и сделает business value команды ещё выше.

Задачи:

  • управление командой DS;
  • взаимодействие с заказчиками из разных бизнес-юнитов;
  • построение и улучшение ML-архитектуры процессов обработки данных;
  • разработка ML-моделей, настраивание их качественной и количественной оценки, анализ результатов;
  • доработка и применение LLM-моделей (ChatGPT, LLaMa и др.) в бизнес-процессах компании.

Требования:

  • высшее техническое или математическое образование;
  • опыт управления командой DS/ML от двух лет;
  • опыт вывода в прод классических ML-моделей (например, бустингов);
  • опыт работы с Python (Pandas, NumPy, SciPy, CatBoost, XGBoost), SQL, Airflow, BI-системами — Datalens/Superset/Tableau/Power-BI;
  • опыт работы с Hadoop, PostgreSQL или YT;
  • умение работать с математической статистикой для управления статзначимостью метрик моделей и пайплайнов.
Будет плюсом опыт работы с LLM-моделями.