О компании
ПСМ Анлим — IT-компания промышленной группы ПСМ, одного из крупнейших российских производителей промышленных электростанций и насосных систем (20+ лет). Мы развиваем направление локальной AI-инфраструктуры: on-prem AI-контуры для заказчиков, которым публичное облако не подходит по требованиям ИБ, локализации данных или энергетической автономии.
Нам нужен senior-инженер, который станет техническим ядром AI Factory PSM Unlim: поможет спроектировать и собрать локальную AI-платформу, а также будет руководить специалистами, обучать их и формировать инженерные стандарты направления.
Что нужно делать:
- проектировать и развивать backend локальной AI-платформы;
- создавать AI Gateway / Router для маршрутизации запросов;
- развивать Model Registry и управление версиями моделей;
- собирать RAG-контур: ingestion, OCR, parsing, chunking, embeddings, retrieval;
- интегрировать Qdrant / Milvus / аналоги;
- подключать локальные и внешние LLM / VLM;
- проектировать API для AI-сервисов;
- интегрировать AI-контур с 1C / ERP / Bitrix24 / CRM / DMS / Service Desk / MES / SCADA;
- строить мониторинг качества ответов, latency, ошибок, логов и нагрузки;
- участвовать в пилотах с клиентами и технических решениях по AI Cluster / AI Factory.
- формировать внутренние стандарты разработки и эксплуатации AI-платформы: шаблоны сервисов, документация, тестовые наборы, логирование и метрики.
- руководить специалистами: ставить задачи, проводить code review, обучать RAG / OCR / LLMOps / backend-подходу;
Что важно:
- production backend важнее академического ML;
- опыт RAG и интеграций важнее “пробовал ChatGPT API”;
- опыт локальных моделей, GPU-инференса и закрытых контуров - сильный плюс;
- умение работать с ИБ, DevOps, архитектором и бизнес-заказчиком - обязательно;
- нужен человек, который может быть техническим лидером и наставником команды, а не только исполнителем задач.
- опыт наставничества, code review, постановки задач и обучения junior / middle специалистов - обязательная часть роли.
Стек:
Python, FastAPI, Docker, Kubernetes, PostgreSQL, Redis, Kafka / RabbitMQ, Qdrant / Milvus, LangChain / LlamaIndex или собственная RAG-архитектура, vLLM / SGLang / Ollama / TGI как плюс, MLflow / ClearML / DVC как плюс, Prometheus / Grafana, GitLab CI/CD, OCR / parsing, LLM / RAG, GPU-инференс.
Что предлагаем:
- наши сотрудники получают исключительно "белую" зарплату: (оклад + премия + годовой бонус). Цифры обсудим с каждым кандидатом индивидуально.
- мы постоянно развиваемся и растем: обучение за счет компании, ТОПовые тренеры и спикеры, участие в семинарах и профессиональных конференциях;
- возможность построить локальную AI-платформу промышленного уровня ;
- роль технического ядра AI Factory PSM Unlim;влияние на архитектуру, стек, команду и продуктовую стратегию;