Москва
Сегодня почти вся онлайн-жизнь собрана в почтовых и облачных сервисах. Лента фото и документов в Облаке, билеты, заказы и чеки в Почте — это далеко не все артефакты, которые при правильном подходе могут улучшить качество онлайн-потребления для пользователей Mail.
Наша задача как ML-команды заключается в том, чтобы эту информацию отфильтровать, структурировать и предоставить пользователю в наиболее удобном и ценном виде. Это «умная» часть сервисов Mail.
Что мы предлагаем
- Возможность работать над продуктами, которыми пользуются миллионы людей
- Реализация передовых ML-решений в HighLoad-окружении: через нас проходят миллиарды писем и файлов пользователей, которые необходимо обрабатывать и анализировать
- Работа над широким спектром задач: классический ML, NLP/LLM, CV
- Возможность тесной связи с продуктовыми командами и прямое влияние на ключевые бизнес-показатели
Мы ищем специалистов, которые
- Любят разбираться во внутренних тонкостях алгоритмов и кастомизировать их для повышения продуктового эффекта
- Проявляют живой интерес к последним тенденциям в машинном обучении и практикам разработки, стремятся их применить в наших сервисах
Задачи
- Разработка и развитие подходов и моделей машинного обучения в Почте и Облаке
- Representation learning для описания поведения и интересов пользователей
- Извлечение сущностей и создание событий в Календаре и Покупках
- Развитие наших LLM-моделей
- Разработка нейродайджеста
- Автоматизация поддержки пользователей генеративными и дискриминативными моделями
Требования
- Отличное знание основ машинного обучения
- Опыт разработки с использованием Python/C++ два-три года
- Уверенное знание теории вероятностей и математической статистики
- Понимание структур данных и алгоритмов
- Знание современных алгоритмов обработки естественного языка (word embeddings, LSTM, Transformers, etc.)
- Опыт работы с библиотеками для глубокого обучения (Pytorch, TensorFlow, Keras, etc.)
Будет плюсом
- Отличные коммуникативные навыки
- Опыт разработки микросервисных архитектур
- Знание стека технологий Hadoop (Spark)
- Хорошее знание C++/LUA
- Опыт использования Docker/Kubernetes