Старший разработчик-исследователь (ML NLP)

Дата размещения вакансии: 24.02.2025
Работодатель: VK
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Сегодня почти вся онлайн-жизнь собрана в почтовых и облачных сервисах. Лента фото и документов в Облаке, билеты, заказы и чеки в Почте — это далеко не все артефакты, которые при правильном подходе могут улучшить качество онлайн-потребления для пользователей Mail.

Наша задача как ML-команды заключается в том, чтобы эту информацию отфильтровать, структурировать и предоставить пользователю в наиболее удобном и ценном виде. Это «умная» часть сервисов Mail.

Что мы предлагаем

  • Возможность работать над продуктами, которыми пользуются миллионы людей
  • Реализация передовых ML-решений в HighLoad-окружении: через нас проходят миллиарды писем и файлов пользователей, которые необходимо обрабатывать и анализировать
  • Работа над широким спектром задач: классический ML, NLP/LLM, CV
  • Возможность тесной связи с продуктовыми командами и прямое влияние на ключевые бизнес-показатели

Мы ищем специалистов, которые

  • Любят разбираться во внутренних тонкостях алгоритмов и кастомизировать их для повышения продуктового эффекта
  • Проявляют живой интерес к последним тенденциям в машинном обучении и практикам разработки, стремятся их применить в наших сервисах

Задачи

  • Разработка и развитие подходов и моделей машинного обучения в Почте и Облаке
  • Representation learning для описания поведения и интересов пользователей
  • Извлечение сущностей и создание событий в Календаре и Покупках
  • Развитие наших LLM-моделей
  • Разработка нейродайджеста
  • Автоматизация поддержки пользователей генеративными и дискриминативными моделями

Требования

  • Отличное знание основ машинного обучения
  • Опыт разработки с использованием Python/C++ два-три года
  • Уверенное знание теории вероятностей и математической статистики
  • Понимание структур данных и алгоритмов
  • Знание современных алгоритмов обработки естественного языка (word embeddings, LSTM, Transformers, etc.)
  • Опыт работы с библиотеками для глубокого обучения (Pytorch, TensorFlow, Keras, etc.)

Будет плюсом

  • Отличные коммуникативные навыки
  • Опыт разработки микросервисных архитектур
  • Знание стека технологий Hadoop (Spark)
  • Хорошее знание C++/LUA
  • Опыт использования Docker/Kubernetes