з/п не указана
Санкт-Петербург
От 1 года до 3 лет
Команда блока «Корпоративно-инвестиционный бизнес» Сбера ищет таланты. Вакансия стажёр Data Scientist для бакалавров и магистров.
Если вы уверенно работаете с Python, знакомы с NLP и NEL задачами и владеете SQL, приглашаем присоединиться к разработке AI-помощников на основе GigaChat для сотрудников банка.
Обязанности
Что предстоит делать?
- работать с текстовыми данными (NLP)
- решать задачи извлечения сущностей (NER/NEL)
- обучать и оценивать классификаторы и ранжирующие модели
- участвовать в подготовке данных и признаков для моделей
- проводить оценку качества пайплайнов
- предлагать и проверять гипотезы по улучшению качества решений.
Требования
- обязательно - текущее обучение на очной форме (бакалавриат или магистратура), техническая специальность
- хорошее знание Python
- базовые знания NLP и опыт работы с русским текстом
- умеете решать NER/NEL задачи, понимание базовых принципов классического ML
- понимание принципов retrieval-подходов и семантического поиска
- опыт работы с векторными базами данных, умеете анализировать и интерпретировать данные, выстраивать предположения на их основе
- знание SQL на базовом уровне, владеете инструментами для парсинга сайтов.
Плюсом будет:
- опыт работы с BERT / RoBERTa-подобными моделями (inference или fine-tuning)
- опыт работы с retrieval-augmented подходами (RAG или аналогичные архитектуры)
- опыт работы с ELK
- библиотеки: pandas, numpy, scikit-learn, natasha, pymorphy, nltk, requests/aiohttp, bs4, playwright, sqlalchemy.
Условия
- оплачиваемая стажировка
- длительность стажировки 3 месяца (40 часов в неделю)
- комфортный современный офис IT Хаб Сбера: Санкт-Петербург, ул.Уральская, д.1 (ст.метро Василеостровская/Приморская/Спортивная)
- офисный формат работы, пн-пт с 9:00 до 18:00.