от 127500 RUR
Москва
От 1 года до 3 лет
Обязанности:
- разработка, настройка и поддержка LLM-решений: fine-tuning (с использованием Unsloth/LoRA), построение RAG- и агентных систем;
- развертывание и мониторинг inference-сервисов, оптимизация производительности и стоимости (кеширование, управление контекстом, rate limiting);
- обеспечение безопасности: защита от prompt injection, соблюдение data governance и установка policy guardrails;
- ведение экспериментов с воспроизводимостью (MLflow), написание тестов (unit, golden, fuzzing), участие в CI/CD, документирование и соблюдение best practices.
Требования:
- опыт интеграции OpenAI API, проектирования устойчивых промптов, построения RAG- и агентных систем, работа с векторными базами данных, data ingestion, fine-tuning;
- уверенное применение MLOps-практик: управление экспериментами (MLflow), CI/CD для моделей, мониторинг в продакшене, тестирование (golden tests, fuzzing промптов);
- навыки разработки в JupyterLab, интеграции с backend-сервисами;
- свободное владение английским и китайским языками.
Условия:
- релокация в Республику Татарстан;
- конкурентный уровень з/п;
- дневная рабочая неделя (ненормированная);
- транспорт до работы из г. Елабуга, г. Набережные Челны, г. Менделеевск, г. Нижнекамск;
- работа в крупной и стабильной компании – в структуре самой большой ОЭЗ в Европе.