з/п не указана
Москва
не требуется
Друзья, ищу ML-щика в проект.
Делаем чат-бота который продаёт NSFW контент. Нужно чтобы модель
понимала когда пушить, когда греть, когда закрывать.
Обучаем на реальных диалогах с метками конверсий.
Из интересного — хочу попробовать KTO/DPO вместо
классического SFT, есть гипотеза что для sales-задач
это должно работать лучше.
Стек: Mistral/Llama, LoRA, vLLM, FastAPI.
Данные есть, клиенты есть, интеграция готова.
Нужен кто-то кто шарит в современных методах alignment
и умеет доводить до прода.