Middle Data Scientist

Дата размещения вакансии: 13.04.2026
Работодатель: DSCS.pro
Уровень зарплаты:
з/п не указана
Город:
Санкт-Петербург
14-я линия Васильевского острова 39
Требуемый опыт работы:
От 1 года до 3 лет

Привет! Мы, команда лаборатории прикладного искусственного интеллекта в ФИЦ РАН, создаем решения, объединяющие фундаментальные исследования, образование и индустрию. Работаем совместно с внешними командами, в том числе из Сбера и РАНХиГС. Ищем коллегу на позицию младшего графического дизайнера для работы над представлением наших решений.

ЗАДАЧИ:

  • Работать с LLM и RAG: Разрабатывать и внедрять подходы по улучшению качества ответов языковых моделей за счет retrieval-augmented generation. Оптимизировать стратегии поиска и реранжирования.

  • Создавать интеллектуальных агентов: Проектировать и реализовывать агентов на современных фреймворках (Pydantic AI, LangGraph).

  • Решать классические NLP-задачи: Извлечение и связывание именованных сущностей (NER/NEL) из неструктурированных русскоязычных текстов.

  • Моделировать: Обучать и оценивать классификаторы и ранжирующие модели, обеспечивая их стабильную работу в продакшене.

  • Анализировать данные и качество: Проводить глубокую оценку качества ML-пайплайнов, выдвигать и проверять гипотезы по улучшению метрик. Готовить данные и признаки для обучения моделей.

ТРЕБОВАНИЯ:

  • Обязательно наличие профильного высшего образования
  • Уверенный Python (ООП, API, чистый код) и SQL (sqlalchemy/alembic).

  • Сильные NLP-навыки и опыт работы с русским текстом: решение задач NER/NEL, понимание морфологии и синтаксиса.

  • Опыт построения LLM-агентов на современных фреймворках (LangGraph, Pydantic AI или аналоги).

  • Понимание retrieval-подходов (RAG, семантический поиск) и опыт работы с векторными БД.

  • Хорошее понимание ML: классификация, ранжирование, метрики, подготовка признаков.

БУДЕТ ПЛЮСОМ:

  • Опыт файн-тюнинга/инференса BERT / RoBERTa, работа с GigaChat.

  • Знакомство с ELK и современными архитектурами LLM (MoE/Dense).

НАШ СТЕК:

  • NLP: Natasha, Pymorphy, DeepPavlov, Transformers

  • Агенты и пайплайны: Pydantic AI, LangGraph

  • Backend / Data: SQLAlchemy, Alembic

УСЛОВИЯ:

  • Работа в офисе, возможен гибрид
  • Обсуждаемая заработная плата