Санкт-Петербург
улица Льва Толстого 16
улица Льва Толстого 16
Наша команда занимается аналитикой базовой технологии, лежащей под капотом Алисы, Нейропоиска, Нейробраузера и многих других продуктов, — большой языковой модели YandexGPT. Вот некоторые из наших рабочих вопросов:
- Как определить, с какими задачами модель справляется хорошо, а с какими — не очень?
- Какие данные добавить в finetune, чтобы обучить модель новой задаче?
- Откуда взять эти данные и как проконтролировать их качество?
- Как построить процесс краудсорсинговой разметки?
Давайте искать на них ответы вместе!
Какие задачи вас ждут
Развитие модели
В эту задачу входят проактивный поиск ошибок модели и исправление проблемных срезов, оценка эффективности изменений и последующее внедрение улучшений.
В эту задачу входят проактивный поиск ошибок модели и исправление проблемных срезов, оценка эффективности изменений и последующее внедрение улучшений.
Формирование базы данных
Вы будете собирать данные для разработки и интеграции новых функций.
Обучение исполнителей
Вам предстоит подбирать и обучать квалифицированных исполнителей, разрабатывать для них систему мотивации, контролировать качество разметки и внедрять процессы для улучшения результатов.
Мы ждем, что вы
- Любите работать с текстовыми данными
- Знаете математическую статистику и теорию вероятностей
- Умеете писать на Python и SQL
- Самостоятельны и готовы браться за новые задачи, для которых нет готового решения
Будет плюсом, если вы
- Работали с Толокой или другими краудсорс-платформами