Senior Data Scientist NLP в команду клиентского сервиса

Дата размещения вакансии: 20.05.2024
Работодатель: Газпромбанк
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

ЧЕМ БУДЕШЬ ЗАНИМАТЬСЯ?

  • Проектировать, разрабатывать и внедрять LLM модели, участвовать в разработке pipeline до промышленной реализации;

  • Создавать генеративные модели, чат-боты;

  • Проводить исследования, проверять гипотезы проекта с использованием LLM в задачах генерации обучающего контента;

  • Работать с текстовыми данными — обращениями клиентов, отзывами, чатами (NLTK, genism, word2vec, Bert, etc);

  • Анализировать различные источники данных, генерировать признаки для построения моделей;

  • Проверять гипотезы, проводить A/B тестирования, EDA;

  • Ресерчить новые подходы и технологии.

МЫ ЖДЕМ, ЧТО ВЫ:

  • Имеете практический опыт полного цикла решения NLP задач: предобработка данных, выбор алгоритмов и тюнинг их параметров, оценка качества моделей, визуализация;

  • Занимались дообучением BERT-Like и GPT-Like моделей;

  • Работали с LLM, prompt engineering;

  • Программируете на Python, R или подобных языках, умеете писать чистый код;

  • Знаете SQL на уверенном уровне (вложенные запросы, оконные функции);

  • Работали с фреймворками PyTorch / TensorFlow;

  • Работали с Linux, bash, системами контроля версий

  • Знаете и понимаете метрики, необходимые для оценки качества генеративных моделей;

  • Имеете высшее образование в области математического моделирования/ информатики/ машинного обучения.

БУДЕТ ПЛЮСОМ, ЕСЛИ ВЫ:

  • Владеете фреймворками автоматизации процессов и оркестрации задач (например, AirFlow, Prefect, Luigi и др.);

  • Работали с системами поддержки жизненного цикла и версионирования моделей (например, MLFlow, DVC);

  • Имеете опыт написания BRD, технической документации.

ЧТО МЫ ПРЕДЛАГАЕМ:
  • Достойный уровень вознаграждения;
  • ДМС со стоматологией с первого месяца работы;
  • Отпуск 33 дня + материальная помощь к отпуску;
  • Полное соблюдение ТК РФ.