Москва
SberDevices — молодая IT-компания полного цикла, входит в экосистему Сбера. Мы уже выпустили разные девайсы для Умного Дома и создали собственные платформы распознавания речи и жестов.
Мы занимаемся разработкой диалоговой части виртуальных ассистентов Салют и проведением исследований с языковыми моделями. Под капотом у нас самые передовые nlp-технологии, собственный диалоговый движок и огромный простор для экспериментов.
Обязанности
- создание новых и переработка текущих датасетов для обучения языковых моделей
- sft-обучение большой языковой модели GigaChat для поддержания новых функций
- аналитика существующих логов для выявления проблем и возможностей для внедрения новых фичей
- обучать мультимодальные модели аля text2image, image RAG
- внедрение новых фичей в продукт с помощью Python.
Требования
- обладаете навыками программирования на Python и PyTorch
- имели опыт обучения больших языковых моделей (LLM)
- имели опыт проведения полного цикла экспериментов: от сбора данных и формирования метрик до поддержки внедрённой фичи
- имели опыт работы hf/transformers и OpenAI API
- имеете опыт с SFT/lora/p-tuning для LLM
- следите за развитием индустрии больших языковых моделей и мультимодальных моделей
Будет плюсом, если вы:
- имеете опыт работы с диалоговыми системами (виртуальные ассистенты, чат-боты)
- знаете инструменты аналитики больших логов
- имеете опыт с dpo
- успешно выступали в соревнованиях по машинному обучению или являетесь выпускником ШАДа.