Middle Data Scientist в стрим моделирования КИБ и СМБ (NLP\классический ML\графовые сети)

Дата размещения вакансии: 03.07.2024
Работодатель: Банк ВТБ (ПАО)
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 1 года до 3 лет

Ищем Data scientist'а в команду, комбинирующую применение бизнес-логики, классических моделей, NLP и LLM.

Обязанности:

  • проведение исследований, проверка гипотез команды с использованием LLM;
  • совершенствование LLM моделей, используя промт-инжиниринг;
  • векторизация документов (для RAG сервиса);
  • преобразование изображения текста в машиночитаемый формат (OCR);
  • разработка и внедрение моделей (NLP\классический ML\графовые сети) в промышленные системы;
  • поиск и обработка данных, создание эмбеддингов, внедрение в текущие процессы.

Требования:

  • высшее математическое/техническое образование;
  • понимание принципов работы с LLM;
  • уверенное знание математики, статистики и машинного обучения;
  • владение Python и опыт практического применения алгоритмов машинного обучения: нейронные сети, композиционные алгоритмы, NLP;
  • уверенное владение SQL (оконные функции, регулярные выражения);
  • опыт работы с Hadoop (HDFS, Hive/Impala), Spark;
  • опыт работы с нейронными сетями на последовательностях.