Москва
Вам предстоит:
- Тестирование и оценка моделей машинного обучения: Проведение экспериментов с различными ML моделями, анализ их производительности и выявление оптимальных решений для новых сервисов;
- Участие в разработке новых сервисов: Активное сотрудничество с командой для создания новых решений на основе искусственного интеллекта, направленных на улучшение бизнес-процессов и оптимизацию существующих систем;
- Ведение проектной документации: Создание и поддержание актуальной проектной и технической документации, включая описания архитектуры, алгоритмов и методов, используемых в разработке;
- Исследование и внедрение новых технологий: Постоянный мониторинг актуальных тенденций в области машинного обучения и искусственного интеллекта, а также поиск способов их применения в рамках компании.
Мы ожидаем:
- Глубокая экспертиза в Python, уверенное использование asyncio, threading и multiprocessing, а также навыки в профилировании и решении задач, связанных с памятью и процессором.;
- Опыт работы с FastAPI и Pydantic v2: знание асинхронной архитектуры и уверенное владение структурой проектов;
- Опыт работы с PostgreSQL, Redis, MongoDB, грамотное проектирование схем, индексация, выбор между ORM и raw SQL;
- Знание Docker и Docker Compose, базовое понимание Kubernetes;
- Опыт в настройке RabbitMQ, Kafka, Celery и Redis, включая реализацию retry-логики, управление дубликатами и dead-letter очередями, а также экшн локеры;
- Опыт разработки микросервисов, выделение высоконагруженных зон, кэширование и создание stateless приложений;
- Умение быстро собрать интерфейс на HTMX/Bootstrap или Streamlit.
Будет преимуществом:
- Опыт работы с LLM, включая OpenAI, Claude и DeepSeek: навыки в кастомизации промптов, оптимизации затрат и качества, а также в использовании функциональных вызовов и потоковой передачи данных;
- Знания в области RAG-систем: опыт построения полного пайплайна от чанкинга до эффективного поиска информации. Понимание выбора векторных баз данных и графов знаний;
- Умение создавать чат-ботов ассистентов с цепочками вызовов, memory, fallback, multi-agent;
- Знание решений TorchServe, Triton и ONNX, а также понимание квантования модели и интеграции локальных моделей с GPT;
- Опыт работы с MLOps (MLflow, Weights & Biases, мониторинг метрик, логирование, отслеживание версий).
Мы предлагаем:
- Работу в крупной международной компании;
- Официальное оформление по ТК РФ;
- Полностью белую заработную плату;
- График: 5/2, полностью удаленный формат работы;
-
Возможность посещения офиса - м. Проспект Мира (5 минут пешком).
Дополнительные бонусы:
- Работа в дружной команде и развитая корпоративная жизнь;
- Возможность профессионального и карьерного роста, гибкое отношение к новым идеям;
- Возможность повышения квалификации и переподготовки по выбранной специальности в нашем корпоративном университете с получением сертификата или диплома;
- Программа ДМС;
- Корпоративные скидки в фитнес-клубы;
- Премиум доступ к платформе со скидками от партнеров;
- Подарки на день рождения;
- Доплата к больничным и отпускам до полной заработной платы.