Senior Data Scientist (NLP, LLM)

Дата размещения вакансии: 21.10.2024
Работодатель: Газпромбанк
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 1 года до 3 лет

Команда Департамента Анализа данных и моделирования нацелена на максимально эффективное использование данных. Мы верим, что можем сделать Банк лучшим для внутреннего и внешнего клиента за счет датацентричности и проникновения моделирования во все сферы деятельности.

Управление алгоритмов машинного обучения занимается развитием компьютерного зрения, речевых технологий, графов и гео.

Задачи, которые мы тебе доверим:
• имплементация и обучение SOTA NLP моделей, как для русского языка, так и мультиязычных;
• эксперименты по созданию новых архитектур, оценка языковых моделей;
• работа над созданием надежного, быстрого и масштабируемого пайплайна для обучения LLM;
• адаптация LLM для задач обслуживания внутренних и внешних клиентов, адаптация LLM под специфичные домены;
• задачи полнотекстового анализа: кластеризация, классификация, тематическое моделирование, выделение именованных сущностей, суммаризация, идентификация трендов, анализ тональности;

• речевая аналитика (оценка качества работы операторов, формирование рекомендации);
• анализ обращений и отзывов;
• разработка чат-ботов;
• применение ML/DL на KG и базах знаний;
• тестирование данных, гипотез, моделей;
• доведение разработанной модели до вывода в production;
• общение с продуктовой командой, бизнес-заказчиком и определять компоненты ml-продуктов;
• разработка system design решений;
• управление полным циклом разработки: взаимодействие с аналитиками, дата инженерами, MLOps- и DevOps-специалистами.

Наши ожидания от кандидата:

• высшее техническое/математическое образование;
• опыт работы DS от 3 лет;
• понимание принципов классического ML, владение стандартным набором python-библиотек для ML;
• опыт работы с NLP, понимание текущего состояния в области NLP (отдельные архитектуры, конкретные приложения к задачам);
• опыт работы с языковыми моделями, понимание подходов к обучению LLM;
• хорошее понимание современных архитектур нейронных сетей;
• умение читать и разбирать статьи о новых архитектурах и подходах;
• понимание принципов обучения, тюнинга, оценки deep learning моделей;
• опыт отладки нейронных сетей и модификации архитектур или создания собственных;• опыт внедрения моделей в production, построения промышленных NLP решений с применением DL алгоритмов;
• понимание принципов ведения разработки, ведения документации;
• умение говорить с бизнес-заказчиком на одном языке, переводить задачу с языка бизнеса в ML постановку;
• способность самостоятельно делать R&D в новых темах;
• умение работать в команде;
• уверенное знание SQL, Python, PyTorch, Docker, Hadoop, DVC, git.

Что мы предлагаем:

• полностью удаленный формат работы из любого города;

• уровень зп обсуждается по итогу собеседования, но у нас также есть премиальная и бонусная система выплат и регулярные процедуры пересмотра уровня зп и грейда;

• возможность прокачать персональный бренд, участвуя в профессиональных конференциях и делая публикации с помощью команды DevRel.