ML-engineer (GigaChat Data Alignment)

Дата размещения вакансии: 28.03.2025
Работодатель: СБЕР
Уровень зарплаты:
з/п не указана
Город:
Москва
Кутузовский проспект 32
Требуемый опыт работы:
От 1 года до 3 лет

Мы - команда ML-инженеров GigaChat Data. Наша команда готовит данные для обучения всей линейки моделей LLM GigaChat (GigaChat, GigaChat Vision, GigaChat Audio, Giga Embeddings и др.). Мы собираем данные как для базовых моделей, так и для их адаптации под конкретные сценарии:
• Core модели – базовые модели;
• Продукты B2C – WEB-версия GigaChat, персонализированные интеллектуальные ассистенты и пр.;
• Внутренние банковские задачи – автоматизация обработки документов, анализ финансовых данных, поддержка сотрудников и пр.;
• Внешние заказчики – кастомные решения для корпоративных клиентов, интеграция LLM в бизнес-процессы и пр.

Обязанности :

  • Сбор данных для alignment обучения моделей: Supervised Finetuning (SFT), Reinforcement Learning (RL, DPO , PPO, GRPO и пр.)
  • Улучшение пайплайнов предобработки данных для разметки и обучения;
  • Работа в плотной связке с командой ML, LoRA-finetuning
  • Взаимодействие с командой асессоров/ разметчиков (мониторинг качества, корректировка инструкций и пр.)
  • Расчет метрик и принятие решений по улучшению качества данных на их основе.

Требования:

  • Знания Python на очень высоком уровне
  • Опыт работы с проприетарными и open-source LLM (Llama, Mistral, Qwen, Google Gemini, OpenAI GPT, Anthropic и пр.)
  • Понимание процессов работы с данными для больших языковых моделей
  • Способность решать проблемы и организовывать работу в условиях многозадачности.

Будет плюсом:

  • Опыт работы с LLM-агентами (LangChain, LangSmith, LangGraph, FAISS, RAG, ChromaDB и пр.).

Условия:

  • Гибкий стек инструментов и технологий – можно пробовать новое, если точно знаете, зачем
  • Адекватный подход к управлению – мы не ставим нереальных сроков и не предлагаем поработать в выходной ради высшего блага
  • Работа с крупнейшими массивами данных на рынке России
  • Гибкий график для оптимального баланса работы и личной жизни, возможна удалёнка
  • Дружный коллектив и здоровая атмосфера взаимопомощи
  • Амбициозные задачи
  • Профессиональное обучение, семинары, тренинги, конференции, корпоративная библиотека
  • ДМС, страхование жизни
  • Свободный дресс-код
  • Льготные кредиты и корпоративные скидки.