Москва
Наша команда занимается разработкой и применением языковых моделей для улучшения опыта клиентов и сотрудников Центра Снабжения. Одно из основных направлений работы — повышение технологичности закупочных и логистических процедур в Сбере. Наши разработки: NER-модели для проверки подлинности документов, AI решения для задач анализа, поиска, генерации по текстовым данным на основе LLM.
Мы активно занимаемся адаптацией GigaChat для решения задач QA, суммаризации и генерации текстов.
Основной стек: PyTorch, Transformers, Accelerate, DeepSpeed
Стек LLM: LangChain, PEFT
Архитектуры: E5, LLaMA, BERT-like
Обязанности
- Работа над моделями мэтчинга, поиска, извлечения сущностей (включая использование LLM).
- Дообучение генеративных LLM для различных задач (включая, суммаризацию, QA, генерацию диалогов).
Требования
- Уверенное знание Python (3.8+)
- Способность оценить качество созданной модели или AI-решения, понимание плюсов/минусов той или иной метрики для конкретной задачи;
- Глубокое знание методов классического NLP, понимание DL-архитектур
- Опыт коммерческой разработки моделей для решения NLP задач от 3 года;
- Опыт разработки моделей на pytorch;
- Опыт дообучения моделей на трансформерах (BERT,E5, etc);
- Понимание как работают генеративные LLM;
Будет плюсом:
- Опыт дообучения моделей (LLAMA, BERT-like)
- Опыт работы с языковыми моделями для задач Seq2Seq
- Знание метрик для задач мэтчинга, поиска, извлечения сущностей, суммаризации.
Условия
- рабочее место в современном офисе: Lounge-зоны, зоны коворкинга, кафе, оборудованные кухни, спортивный зал
- график работы: первые 3 месяца офис, дальше - гибрид
- оклад + годовое премирование и социальная поддержка сотрудников
- ДМС для сотрудников и льготная медицинская страховка для близких
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- возможность участвовать в корпоративной жизни: «Зелёный марафон», Сбербанкиада, КВН, волонтёрские программы и т.д.