Ищем ML-аналитика, который поможет развивать внутреннюю систему автоматического анализа текстов на базе больших языковых моделей (LLM). Проект долгосрочный, задачи — реальные и сложные: от построения классических моделей до внедрения LLM в промышленную среду.
Задачи:
-
разработка и внедрение сценариев анализа текстовых документов с применением LLM
-
настройка и оптимизация промптов, построение RAG-пайплайнов
-
улучшение стабильности и качества существующих ML-решений
-
участие в интеграции моделей в промышленную среду (в связке с DE, MLOps и другими командами)
Наши ожидания:
-
опыт промышленной разработки и внедрения ML-моделей
-
знание классического ML и алгоритмов
-
уверенное владение Python-стеком: LightGBM, XGBoost, CatBoost, Scikit-learn, Pandas, Numpy
-
опыт работы с Hadoop, Spark, Hive
-
понимание принципов работы с LLM и желание развиваться в этом направлении
Будет плюсом:
-
опыт в NLP и работе с текстами
-
знание PyTorch, опыт с DL-алгоритмами
-
участие в разработке ML-библиотек (контрибьют)
-
full-stack навыки
Если ваш опыт и интересы совпадают с задачами проекта — откликайтесь, будем рады обсудить подробнее.