ML-инженер

Дата размещения вакансии: 02.02.2026
Работодатель: Симбиоз
Уровень зарплаты:
от 110000 RUR
Город:
Екатеринбург
Восточная улица 56
Требуемый опыт работы:
От 1 года до 3 лет

Команда проекта Nastavnik (компания Simbioz) приглашает ML‑инженера, который поможет построить «мозг» нашего AI‑наставника для адаптивного обучения. Мы развиваем инновационную платформу в сфере EdTech, где ИИ подстраивает обучение под каждого ученика в режиме реального времени.

Наша технология — гибридная система, которая диагностирует знания ученика и выбирает оптимальную образовательную стратегию. Это сложная и амбициозная задача на стыке современного AI и образования, и вы можете стать тем, кто её решит.

Ключевые задачи:
  • Разработка, обучение и валидация DKT-модели (на базе LSTM/GRU или аналогов) для отслеживания вектора знаний пользователя в реальном времени.
  • Проектирование и создание симуляционной среды («цифрового двойника» ученика) на основе собранных данных для безопасного офлайн-обучения RL-агента.
  • Реализация и обучение DQN-агента, который будет принимать педагогические решения (какой контент показать следующим).
  • Проектирование эффективной функции вознаграждения (reward function) для RL-агента, мотивирующей его на реальное улучшение знаний пользователя.
  • Проведение экспериментов, анализ метрик и итеративное улучшение всего ML-пайплайна.
Что мы ожидаем от вас:
  • Глубокое знание Deep Learning, опыт работы с нейросетями для обработки последовательностей (RNN, LSTM, Transformers).
  • Четкое понимание принципов обучения с подкреплением (Reinforcement Learning).
  • Опыт коммерческой разработки на Python и глубокое знание фреймворков PyTorch или TensorFlow.
  • Опыт работы с классическими задачами Data Science: от сбора и очистки данных до инженерии признаков.
  • Умение и желание читать научные статьи и применять state-of-the-art подходы на практике.
  • Практический опыт оптимизации промптов и знание инструментов
  • MLFlow, Git, Postgres, FastApi, Docker, CI/CD, PrompLayer или LangSmith
Идеально, если вы:
  • Имеете практический опыт обучения RL-агентов, в частности DQN.
  • Разрабатывали симуляционные среды для RL-задач.
  • Участвовали в Kaggle-соревнованиях или имеете другие примеры решения сложных ML-задач.
Мы предлагаем:
  • Уникальную и сложную R&D задачу, результаты которой станут ядром инновационного продукта.
  • Возможность работать с передовыми технологиями в области AI.
  • Минимум бюрократии и максимум влияния на технические решения.
  • Удаленный формат работы и гибкий график.
  • Конкурентную заработную плату по итогам собеседования.
Если вы увлечены Reinforcement Learning и хотите применить свои знания для создания продукта, который изменит образование, — мы ждем ваше резюме!