улица Измайловский Вал 20
Федеральное государственное бюджетное учреждение запускает стратегический проект по созданию собственной языковой модели (LLM) для внутреннего использования. Модель будет разрабатываться с нуля под закрытым контуром организации – от выбора архитектуры и платформы до программирования, обучения и внедрения в рабочие процессы. Мы ищем ключевого специалиста, который возьмёт на себя полный технический цикл и сформирует ИИ-направление внутри учреждения.
Обязанности:
-
провести анализ потребностей и определить оптимальную стратегию: обучение модели с нуля или глубокая адаптация открытых решений под закрытый контур;
-
сформировать с нуля и возглавить команду, распределить зоны ответственности между ML-инженерами, дата-инженерами и DevOps;
-
спроектировать архитектуру LLM, выбрать стек технологий, фреймворки и вычислительную платформу (on-premise или доверенная облачная среда) с учётом ограничений бюджетной организации и требований информационной безопасности;
-
организовать полный цикл работы с данными: сбор, очистка, фильтрация, токенизация и разметка корпуса внутренних текстов с соблюдением законодательства о персональных данных и государственной тайны;
-
обучить, валидировать и оптимизировать модель под ключевые бизнес-задачи (генерация документов, смысловой поиск, вопросно-ответные системы, классификация, суммаризация);
-
развернуть LLM в продуктивном закрытом контуре, обеспечить стабильность и безопасность инференса, реализовать API для интеграции с внутренними информационными системами.
Требования:
-
подтверждённый успешный опыт создания языковой модели с нуля (предобучение или глубокая адаптация под закрытый контур) с измеримым результатом: в резюме или портфолио должна быть раскрыта ваша роль и достигнутые показатели;
-
глубокое знание архитектур трансформеров (GPT, BERT, LLaMA и т.п.), опыт работы с PyTorch/TensorFlow, Hugging Face Transformers, библиотеками распределённого обучения (DeepSpeed, Megatron-LM и аналогами);
-
практический опыт подготовки и препроцессинга крупных текстовых массивов для обучения LLM;
-
уверенное программирование на Python; знание C++ будет весомым плюсом;
-
понимание методов оптимизации инференса (квантование, ONNX, TensorRT, vLLM и др.) и требований промышленной эксплуатации, включая мониторинг и отказоустойчивость;
-
высшее техническое или математическое образование;
-
готовность к работе с данными ограниченного доступа, понимание требований 152-ФЗ и нормативов ФСТЭК России (или готовность их оперативно изучить).
Будет плюсом:
-
наличие собственной готовой команды (ML-инженеры, дата-инженеры, DevOps), способной включиться в проект в ближайшее время;
-
опыт построения ИИ-систем в государственных структурах, научных институтах или режимных организациях;
-
знание специфики российских вычислительных платформ и облачных провайдеров (Yandex Cloud, VK Cloud, on-premise GPU-фермы);
-
опыт внедрения LLM в контуре, изолированном от сети Интернет, и опыт прохождения аттестации информационных систем.
Условия работы:
-
работа в комфортном офисе в центре Москвы (2 минуты пешком от м. Семеновская), возможен гибридный формат работы;
-
оформление согласно ТК РФ;
- уровень заработной платы зависит от уровня должности, квалификации кандидата и обсуждается на финальном собеседовании с успешным кандидатом;
- полная занятость, рабочий день с 9.00. до 18.00., в пятницу до 16.45.
- отпуск 28 календарных дней+4 дня дополнительно;
-
масштабная и интеллектуально амбициозная задача: создание языковой модели с нуля, которой будут пользоваться реальные подразделения учреждения;
-
высокая степень самостоятельности в выборе архитектуры, платформы и инструментов;
-
возможность собрать под себя команду и выстроить долгосрочное ИИ-направление.