Новинский бульвар 8
Какие задачи вас ждут:
Составлять выборки и обучать на них ML-модели
Мы постоянно разрабатываем новые инструменты, адаптируем существующие под конкретные бизнес-задачи, а также внедряем крупные ML-технологии, появляющиеся в Яндексе. Вы будете составлять различные выборки и обучать на них ML-модели, в том числе BERT, DSSM, CatBoost, YandexGPT.
Исследовать данные Маркета и делать выводы на их основе
Вам предстоит анализировать партнёрский контент (описание, параметры и прочую метаинформацию о товарах), а также историю прохождения товаров через внутренние бизнес-процессы, делать выводы об эффективности этих процессов и искать узкие места.
Взаимодействовать с системами краудсорсинга по разметке данных для обучения
У нас нет пользовательских логов в привычном понимании, поскольку наши пользователи — продавцы. Для новой задачи почти никогда нет готовой разметки, приходится собирать её с помощью асессоров и строить процессы автоматизации сбора таких данных.
Мы ждем, что вы:
- Аналитически мыслите
- Разрабатывали нейросети с использованием PyTorch или другого фреймворка для работы с текстами
- Понимаете принципы работы распределённых вычислительных систем, работали со стеком Hadoop (Spark, Hive)
- Знаете классические алгоритмы и структуры данных
- Способны самостоятельно искать и находить ответы на вопросы, разбираться в сложных системах и сервисах, читая код и документацию
- Хорошо знаете SQL, умеете писать сложные запросы
- Способны быстро обучаться и воспринимать большой объём новой информации