Москва
Команда AI VK развивает технологии искусственного интеллекта для ключевых продуктов компании, разрабатывает систему рекомендаций и поиска контента на наших платформах, чтобы 95% пользователей рунета быстро и эффективно решали свои задачи с помощью сервисов VK.
Наша команда отвечает за качество поиска по видео, текстам, музыке в Одноклассниках, ВКонтакте и Дзене. А ещё мы делаем поиск для голосового ассистента Маруся. Мы ищем разработчика, готового вместе с нами помогать десяткам миллионов пользователей быстро и легко находить нужное в рунете.
В работе мы используем:
- для обучения и инференса — PyTorch, CatBoost, Scikit-learn, Pandas, ONNX Runtime, TensorRT;
- для инженерных задач — Python для обработки данных и обучения, C++ для программирования в бэкенде, немного Java для работы с петабайтами данных.
Задачи:
- обучать модели ранжирования поисковой выдачи;
- обучать модели классификации текстов, музыки, видео;
- придумывать и реализовывать новые факторы ранжирования;
- реализовывать идеи, алгоритмы и модели из научных статей;
- выдвигать гипотезы, получать данные для их проверки, ставить эксперименты и анализировать их результаты;
- следить за актуальными подходами к информационному поиску и учитывать их.
Требования:
- вы уже работали с машинным обучением — знаете базовую теорию, классические алгоритмы ML и Deep Learning, современные подходы в NLP;
- имеете опыт реализации ML-проектов от постановки задачи до выведения в продакшен и оценки результатов;
- отлично владеете Python;
- хорошо знаете классические алгоритмы и структуры данных.
Будет плюсом:
- вы знаете Java, знакомы с алгоритмами обработки больших данных и парадигмой MapReduce;
- вы знаете основы C++, чтобы понимать код нашего поискового бэкенда;
- интересуетесь поиском или рекомендательными системами и хорошо в них разбираетесь;
- внедряли нейросетевые решения и умеете оптимизировать время инференса и потребление ресурсов;
- самостоятельно ставили A/B-эксперименты.
У нас интересно, потому что вы сможете:
- максимально свободно формировать гипотезы;
- проверять самые невероятные идеи;
- увидеть и «пощупать» результаты своей работы на многомиллионной аудитории;
- поработать над высоконагруженным сервисом, где скорость работы и исправность любого решения — не формальность, а критически важные факторы.