Разработчик-исследователь

Дата размещения вакансии: 13.11.2024
Работодатель: VK
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Команда AI VK развивает технологии искусственного интеллекта для ключевых продуктов компании, разрабатывает систему рекомендаций и поиска контента на наших платформах, чтобы 95% пользователей рунета быстро и эффективно решали свои задачи с помощью сервисов VK.

Наша команда отвечает за качество поиска по видео, текстам, музыке в Одноклассниках, ВКонтакте и Дзене. А ещё мы делаем поиск для голосового ассистента Маруся. Мы ищем разработчика, готового вместе с нами помогать десяткам миллионов пользователей быстро и легко находить нужное в рунете.

В работе мы используем:

ꔷ для обучения и инференса — PyTorch, CatBoost, Scikit-learn, pandas, ONNX Runtime, TensorRT;

ꔷ для инженерных задач — Python для обработки данных и обучения, C++ для программирования в бэкенде, немного Java для работы с петабайтами данных.

Задачи:

ꔷ обучать модели ранжирования поисковой выдачи;

ꔷ обучать модели классификации текстов, музыки, видео;

ꔷ придумывать и реализовывать новые факторы ранжирования;

ꔷ реализовывать идеи, алгоритмы и модели из научных статей;

ꔷ выдвигать гипотезы, получать данные для их проверки, ставить эксперименты и анализировать их результаты;

ꔷ следить за актуальными подходами к информационному поиску и учитывать их.

Требования:

ꔷ вы уже работали с машинным обучением — знаете базовую теорию, классические алгоритмы ML и Deep Learning, современные подходы в NLP;

ꔷ имеете опыт реализации ML-проектов от постановки задачи до выведения в продакшн и оценки результатов;

ꔷ отлично владеете Python;

ꔷ хорошо знаете классические алгоритмы и структуры данных.

Будет плюсом:

ꔷ вы знаете Java, знакомы с алгоритмами обработки больших данных и парадигмой MapReduce;

ꔷ вы знаете основы C++, чтобы понимать код нашего поискового бэкенда;

ꔷ интересуетесь поиском или рекомендательными системами и хорошо в них разбираетесь;

ꔷ внедряли нейросетевые решения и умеете оптимизировать время инференса и потребление ресурсов;

ꔷ самостоятельно ставили A/B-эксперименты.

У нас интересно, потому что вы сможете:

ꔷ максимально свободно формировать гипотезы;

ꔷ проверять самые невероятные идеи;

ꔷ увидеть и «пощупать» результаты своей работы на многомиллионной аудитории;

ꔷ поработать над высоконагруженным сервисом, где скорость работы и исправность любого решения — не формальность, а критически важные факторы.