ML-архитектор - Reinforcement Learning и оптимизация

Дата размещения вакансии: 09.03.2025
Работодатель: Разумовский Лев Григорьевич
Уровень зарплаты:
от 300000 до 600000 RUR
Город:
Санкт-Петербург
Требуемый опыт работы:
Более 6 лет

AI-архитектор - Reinforcement Learning и математическая оптимизация

Мы ищем того самого человека, который не боится сложных задач, умеет видеть структуру в хаосе и превращать теорию в работающие алгоритмы. Если Reinforcement Learning для вас — это не просто набор формул и модный термин, а инструмент для оптимизации сложных систем, если вы способны самостоятельно довести проект до результата, преодолевая любые преграды, — эта позиция для вас.

О проекте

Мы решаем одну из самых интересных задач в области динамического ценообразования: как построить самообучающуюся систему, которая предсказывает, адаптируется и принимает оптимальные решения в условиях неопределенности. Это не R&D в вакууме — это реальные деньги, рынок (не финтех!), поведение людей и мощные алгоритмы, которые меняют правила игры в индустрии ДЦО.

Что вам предстоит делать

Разрабатывать и внедрять RL-алгоритмы для динамической оптимизации цен.

Проектировать экспериментальные среды для тестирования моделей.

Решать фундаментальные вопросы в области обучения с подкреплением: как лучше формулировать награды, как ускорить обучение, как минимизировать ошибки оценок.

Работать с бизнесом, объясняя сложные математические модели понятным языком.

Доводить решения до production, а не останавливаться на стадии прототипа.

Что мы ищем в вас

Глубокие знания в Reinforcement Learning (не просто читать статьи, а понимать, как это работает изнутри).

Математический бэкграунд (статистика, теория вероятностей, оптимизация, ).

Опыт успешных проектов в RL (если у вас есть реальные кейсы — расскажите нам).

Самостоятельность и проактивность – мы ценим людей, которые берут ответственность, а не ждут инструкций.

Опыт работы с ML-фреймворками и инструментами для RL.

Понимание реального бизнеса или желание разобраться, как AI влияет на рынок.

желание принять участие в разработке продукта для глобального рынка, который имплементирует уникальный инновационный подход к решению проблемы ДЦО.

Почему вам будет интересно

Свобода в выборе решений — мы ожидаем, что вы будете не просто исполнителем, а архитектором системы и генератором идей.

Амбициозный вызов — вам не дадут "игрушечную задачу". Это реальный рынок с миллионами транзакций и огромными оборотами.

Минимум бюрократии, максимум смысла — работа в команде, которая делает результат, а не пишет бесконечные отчеты.

Возможность менять индустрию — ваша работа реально повлияет на рынок, а не останется только в научных статьях (хотя и их мы тоже пишем).

Если это про вас — давайте общаться. Нам нужны уникальные специалисты, которые хотят решать уникальные задачи и добиваться уникальных результатов..