Садовническая улица 82с2
Яндекс Плюс — это единая подписка на сервисы Яндекса, которая даёт доступ к музыке, фильмам, подкастам, книгам, играм, спортивному и другому контенту. Это большой экосистемный проект, где более 35 миллионов подписчиков каждый день используют разнообразные возможности во всех сервисах экосистемы: слушают «Мою волну» в Музыке, получают кешбэк в Такси, Еде, на Маркете и в других сервисах Яндекса, смотрят кино на Кинопоиске.
Наша команда занимается разработкой и внедрением ML в различные механики бизнеса, растит ключевые экономические показатели. В нашем фокусе развитие проектов с использованием классического ML и DL.
Мы регулярно запускаем новые проекты и развиваем ML технологии в наших продуктах. Ищем талантливого разработчика, который поможет усовершенствовать ML инфраструктуру и возьмёт на себя управление ресурсами для решения наших задач. Присоединившись к нам, вы получите возможность видеть непосредственное влияние своих разработок на скорость внедрения ML в прод и runtime инференса LLM.
Вы будете участвовать в интегрировании новейших подходов в рекомендациях оферных продуктов.
Это возможность работать на стыке cutting-edge-технологий и реальной пользы для миллионов людей в одном из самых больших сервисов подписки в России.
Обязанности:
- Разработка runtime ML-backend на Java
Ваша задача — создавать и развивать runtime-фреймворк для инференса ML-моделей, чтобы обеспечивать ML-инженеров удобными и эффективными инструментами. - Разработка и оптимизация компонентов ML-инфраструктуры
Мы запускаем много экспериментов. Развитие инструмента управления экспериментами — ключ к успешным внедрениям. Мы ценим проактивность, поэтому хотим от вас собственных идей и дизайна подобной системы.
-
Ответственность за управление ресурсами
Мы ожидаем, что вы поможете команде понимать ограничения и возможности по ресурсам. Вы будете помогать обеспечивать членов команды доступными мощностями, участвовать в планировании необходимых ресурсов и оптимизировать ML-пайплайны. -
Внедрение LLM в рантайм-прод
Вы будете внедрять LLM в рантайм-прод, чтобы обеспечивать их стабильную и эффективную работу в реальных условиях эксплуатации — с высокой нагрузкой, минимальными задержками и соблюдением SLA.
Мы ждем, что вы:
- Уверенно владеете Java или C++
- Работали с высоконагруженными бэкендами
- Работали с классическими и KV базами данных
- Знакомы с инструментами отладки, профилирования, систем непрерывной интеграции и развёртывания
- Умеете анализировать сложные процессы обработки данных
- Понимаете принципы работы месседж-брокеров
- Знакомы с принципами MapReduce-систем
Будет плюсом, если вы:
- Администрировали сложные сервисы
- Хорошо знаете Linux и обладаете глубоким пониманием сетевых технологий