Мы создаём среду для саморазвивающихся агентов по принципу OpenClaw. Агент должен самостоятельно исследовать окружение, ставить подцели, адаптироваться к изменениям и находить оптимальные стратегии для достижения задач (например, сбор ресурсов, перемещение, выживание). И все это в связке с процессами банка, в частности Бизнес планирования КИБ
Обязанности
- реализация и доработка базового цикла «действие → наблюдение → награда» для агента.
- интеграция агента с игровой/симуляционной средой (например, на базе Python + Gym-like интерфейс или прямой вызов API среды).
- настройка простых архитектур памяти (LSTM/Transformer-small) для учёта истории действий.
- участие в отладке и визуализации поведения агента (логгирование траекторий, тепловых карт действий).
- запуск и анализ учебных экспериментов, подбор гиперпараметров под руководством старшего разработчика.
- написание тестов для проверки базовых навыков агента (избегание препятствий, достижение простых целей).
Требования
базовое знание Python (циклы, классы, функции, работа со словарями/списками).
понимание концепции MDP (Markov Decision Process): состояние, действие, награда, политика.
опыт работы с хотя бы одной из библиотек: PyTorch, TensorFlow, JAX (даже учебные проекты).
знание основных алгоритмов Reinforcement Learning: Policy Gradient, DQN или A2C (на уровне понимания формулы и способности реализовать простой пример).
умение читать и адаптировать чужой код, работать с Git (ветки, pull requests).
английский язык на уровне чтения технической документации и статей (например, OpenAI Spinning Up, CleanRL).
работа с базовыми SQL БД
Условия
- комфортный современный офис г. Сочи Войкова 2
- гибридный формат работы
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха система обучения для профессионального и карьерного развития
- расширенный полис ДМС с первого дня работы и страхование для семьи
- программа ипотеки для сотрудников
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.