ML-engineer (GigaChat Data Alignment)

Дата размещения вакансии: 20.03.2025

Работодатель: СБЕР

Уровень зарплаты:

з/п не указана

Город:

Москва

Требуемый опыт работы:

От 3 до 6 лет

Мы - команда ML-инженеров GigaChat Data. Наша команда готовит данные для обучения всей линейки моделей LLM GigaChat (GigaChat, GigaChat Vision, GigaChat Audio, Giga Embeddings и др.).

Мы собираем данные как для базовых моделей, так и для их адаптации под конкретные сценарии:

• Core модели – базовые модели;

• Продукты B2C – WEB-версия GigaChat, персонализированные интеллектуальные ассистенты и пр.;

• Внутренние банковские задачи – автоматизация обработки документов, анализ финансовых данных, поддержка сотрудников и пр.;

• Внешние заказчики – кастомные решения для корпоративных клиентов, интеграция LLM в бизнес-процессы и п

Обязанности

Сбор данных для alignment обучения моделей: Supervised Finetuning (SFT), Reinforcement Learning (RL, DPO , PPO, GRPO и пр.);
Улучшение пайплайнов предобработки данных для разметки и обучения;
Работа в плотной связке с командой ML, LoRA-finetuning;
Взаимодействие с командой асессоров/ разметчиков (мониторинг качества, корректировка инструкций и пр.);
Расчет метрик и принятие решений по улучшению качества данных на их основе;

Требования

Знания Python на очень высоком уровне;
Опыт работы с проприетарными и open-source LLM (Llama, Mistral, Qwen, Google Gemini, OpenAI GPT, Anthropic и пр.);
Понимание процессов работы с данными для больших языковых моделей;
Способность решать проблемы и организовывать работу в условиях многозадачности.

Будет плюсом:

Опыт работы с LLM-агентами (LangChain, LangSmith, LangGraph, FAISS, RAG, ChromaDB и пр

Условия

Комфортный современный офис рядом с м. Кутузовская
гибрид
ежегодный пересмотр зарплаты и годовая премия
корпоративный спортзал и зоны отдыха
более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
расширенный ДМС, льготное страхование для семьи
ипотека для сотрудников выгоднее до 4%
бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
вознаграждение за рекомендацию друзей в команду Сбера.

Откликнуться

ML-engineer (GigaChat Data Alignment)

Обязанности

Требования

Условия

Похожие вакансии: Москва