Пресненская набережная 10
Мы строим единую систему оценки качества ML-решений в Озоне — от классических моделей до больших языковых моделей. Наша задача — находить лучшие ML-разработки внутри компании, делать их доступными для всех ML-команд и развивать дальше.
Мы верим, что вместо параллельной разработки одних и тех же решений в разных командах можно объединить лучшие практики и поднять общий уровень ML во всей компании — а заодно избавить разработчиков от рутины.
Команда — часть ML-платформы Озон, где работает много сильных ML- и backend-инженеров и есть серьёзные железные ресурсы для экспериментов с передовыми подходами. Ищем ML-разработчика, который усилит команду и поможет двигать ML в Озоне вперёд.
Стек
Python, PyTorch, transformers, фреймворки для инференса (SGLang, vLLM, Triton), Kubernetes.
Вам предстоит
- Работать в связке с самыми передовыми ML-командами Озон — поиском, матчингом и другими, где ML находится в основе продукта.
- Строить бенчмарки для моделей разного класса: LLM (в т.ч. мультимодальные), задачи с LLM-as-a-Judge, модели общего назначения (OCR, ASR, STT), системы семантических эмбеддингов.
- Реализовывать ML-пайплайны полного цикла — от сбора данных до публикации метрик и деплоя.
- Развивать саму платформу: мы её первые пользователи, поэтому напрямую влияем на то, как она устроена и куда движется.
Мы ожидаем
- Глубокое понимание ML: классические подходы, нейронные сети (включая современные трансформеры), NLP, CV.
- Опыт ведения полного цикла ML-исследований: разбор бизнес-требований, постановка задачи и метрик, сбор и подготовка данных, воспроизводимые эксперименты.
- Уверенная работа с инструментами: PyTorch, transformers, MLflow / ClearML / DVC, Label Studio, Triton / vLLM / SGLang, Airflow.
- Хороший Python: скрипты, модули, простые REST API.
- Базовый бэкенд: Docker, Kubernetes, SQL, S3, key-value-хранилища, юнит-тесты, git, понимание CI/CD.
Будет плюсом
- Опыт построения бенчмарков для большого числа моделей.
- Практический опыт работы с современными LLM.
- Знание распределённых систем для Big Data: Hadoop, Spark или YT.