Senior Data Scientist NLP | RND TeamLead в LegaTech

Дата размещения вакансии: 07.05.2025
Работодатель: СБЕР
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Мы — R&D команда проекта GigaLegal в СБЕР, создающая решения в правовой сфере на основе LLM для автоматизации юридических процессов.

Наша цель — трансформировать работу юристов, бизнеса и госструктур через:

Автоматизацию анализа договоров и юридических документов

Интеллектуальную генерацию правовых текстов

Разработку специализированных юридических чат-ботов

Создание автономных юридических ИИ-агентов

Мы в поиске опытного TL|Senior-специалиста, который возьмет на себя ответственность за разработку и внедрение LLM-решений, способных масштабировать бизнес-процессы наших клиентов.

Обязанности

LLM-ориентированные решения :

Проектирование и реализация стратегий адаптации LLM (prompting, fine-tuning, LoRA, RLHF) под специфику юридических задач.

Проектирование и разработка пайплайнов для обработки юридических данных (RAG, агентские системы, семантический поиск).

Проектирование навыков и обучение LLM и NLP/Сlassic ML моделей для реализации бизнес-задач

Оптимизация производительности LLM в production (латентность, стоимость, точность).

Продакшен-инжиниринг :

Внедрение DS-моделей в production с использованием MLOps-практик (CI/CD, мониторинг, A/B-тесты).

Интеграция решений с внешними API, работа с векторными базами, поисковыми движками (ElasticSearch).

Проектирование отказоустойчивых систем для обработки конфиденциальных юридических данных.

Работа с SQL/No SQL БД

Лидерство и экспертиза :

Участие в постановке технических требований и взаимодействие с бизнес-заказчиками.

Проработка с юридическими экспертами, системными аналитиками, стороной заказчиков требований и вариантов решения задач

Проработка с отделом обучения тестовой и обучающей разметки для обучения юридическим навыкам GigaChat и других LLM

Менторство младших коллег, code review, разработка best practices для команды.

Анализ рисков и поиск компромиссов между качеством моделей, скоростью и стоимостью.

Возможно лидирование RND команды проекта и позиция TeamLead

Требования

Опыт : 3+ лет в DS/NLP, включая 1+ год работы с LLM, опыт с production.

Технические навыки :

Готовность как писать код, пайплайны, обучать модели, так и писать документацию, проектировать системы и готовить спецификации на модели, данные, пайплайны.

Глубокая экспертиза в адаптации LLM: SFT, RLHF, LoRA, prompt engineering.

Опыт построения RAG-систем, агентских пайплайнов и сервисов на основе LLM.

Знание современных фреймворков (PyTorch, Hugging Face, LangChain, LlamaIndex).

Уверенная работа с инфраструктурой: Docker, Kubernetes, облачные платформы.

Понимание MLOps: CI/CD, мониторинг дрифта данных, логирование.

Бизнес-ориентированность :

Опыт трансформации бизнес-задач в технические требования.

Умение оценивать ROI DS-решений и балансировать между инновациями и практичностью.

Умение быстро делать прототипы решений и искать баланс между скоростью/качеством/производительностью.

Soft Skills :

Умение аргументировать технические решения перед заказчиками.

Опыт управления мини-проектами и координации команд.

Умение коммуницировать с заказчиками и экспертами в различных доменных областях.

Условия

Мы готовы предложить:

  • комфортный современный офис
  • возможность выбрать удобный график – офис/гибрид
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека для сотрудников выгоднее до 7%
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.