Архитектор XDR /Сервис-менеджер

Дата размещения вакансии: 06.03.2026
Работодатель: Лаборатория Касперского
Уровень зарплаты:
з/п не указана
Город:
Москва
Ленинградское шоссе 39Ас1
Требуемый опыт работы:
Более 6 лет

В команду премиальной поддержки ищем сервис-менеджера on-premises инфраструктуры XDR для одной из крупнейших и самых высоконагруженных инсталляций eXtended Detection and Response (XDR) — с интегрированными компонентами классов IRP, SIEM (KUMA), EDR, система управления антивирусом (KSC).

В этой роли вы будете развивать сервис и обеспечивать его стабильную эксплуатацию: много общаться с клиентом, работать в связке с технической поддержкой, командой SOC-аналитиков и разработкой. Важно уметь соединять потребности бизнеса и «технику» — и вместе с клиентом строить понятную дорожную карту развития решения в его инфраструктуре, учитывая планы клиента и наш роадмап по XDR.

Основные задачи:

  • Развивать и сопровождать сервис XDR и его инфраструктуру (операционные системы, серверы и системы хранения, сетевое оборудование), обеспечивая стабильность, производительность и масштабируемость.
  • Совместно с клиентом согласовывать план развития сервиса: ожидания и приоритеты клиента; текущие возможности решения; будущий product roadmap XDR.
  • Совместное с клиентом управление изменениями в сервисе XDR и влияния на инфраструктуру: подключение новых источников/сенсоров, рост потока событий и нагрузок, изменения правил нормализации/корреляции, изменение сроков хранения и политик; оценка рисков и влияния, планирование работ/окон, согласование с клиентом, контроль внедрения и пост-проверки.
  • Формировать и вести план регулярного обслуживания и проактивной профилактики рисков эксплуатации (capacity-планирование, контроль деградаций, регулярные проверки интеграций, рекомендации по hardening настройкам).
  • Координировать работу вовлечённых команд (Professional Services и Technical Support) в формате «единого окна» по всем вопросам клиента.
  • Лично подключаться к разбору инцидентов и координировать восстановление сервиса при сбоях (до полного восстановления и фиксации корректирующих действий).
  • Регулярно взаимодействовать с продуктовой командой и разработкой XDR: передавать обратную связь клиента, инициировать улучшения, сопровождать устранение дефектов и RCA по сбоям/инцидентам.
  • Проводить регулярные сервис-ревью с клиентом: статус сервиса и ключевые метрики, результаты изменений и работ, разбор инцидентов и проблем, согласование приоритетов и обновление дорожной карты.
  • Выявлять, формализовать и выносить риски эксплуатации сервиса (технические, процессные, ресурсные) на уровень аккаунт-команды; обсуждать вводные и предлагать варианты митигации, фиксировать договорённости и дальнейшие действия со сроками и ответственными.

Какие результаты от Вас ожидаются и какие навыки Вам необходимы:

  • Стабильная работа сервиса XDR в инфраструктуре клиента: высокая доступность и производительность, отсутствие незапланированных и несогласованных простоев.
  • Прозрачное и управляемое внедрение изменений: изменения согласованы, выполняются в окна, проходят пост-проверки, без негативного влияния на сервис.
  • Инженерные работы по XDR выполняются в согласованные сроки и с ожидаемым качеством.
  • Сформирована и исполняется совместная дорожная карта развития сервиса XDR у клиента (приоритеты согласованы, прогресс отслеживается на регулярных ревью).
  • Минимизация критичных эскалаций: решение проблем в режиме единого окна, с понятными сроками и ответственными.

Необходимые Hard и Soft skills:

  • Чем шире ваш опыт и чем по большему количеству пунктов ниже вы имеете реальный опыт, тем заметнее будет ваше преимущество по данной роли.

  • Администрирование баз данных и понимание работы хранилищ под большие потоки событий: ClickHouse, PostgreSQL, SQLite (резервное копирование/восстановление, репликация/HA — где применимо, оптимизация запросов, тюнинг).
  • Контейнеризация и оркестрация: Kubernetes K8S (deploy/upgrade, networking, storage, troubleshooting, базовая безопасность, наблюдаемость).
  • Администрирование Linux в enterprise/on-prem среде: Astra Linux 1.7 «Воронеж» и выше (bonding/team, аудит и журналирование, hardening, performance-тюнинг).
  • Аппаратная платформа и storage: опыт работы с серверами (YADRO и другие вендоры), RAID (уровни, отказоустойчивость, деградации), диагностика железа; тестирование производительности и подбор оптимальной конфигурации под нагрузку; расчёт и обоснование сайзинга.
  • Компьютерные сети для высоких нагрузок: NIC teaming/bonding, диагностика сетевых проблем (потери, дубликаты MAC, ошибки LACP/bonding, влияние неисправного оборудования), понимание построения устойчивой и производительной сетевой архитектуры.
  • Базовые инфраструктурные сервисы предприятия: MS AD DS, ALD Pro, DNS, DHCP (интеграции, эксплуатация).
  • Опыт эксплуатации и администрирования высоконагруженных инсталляций SIEM/IRP/SOAR (EPS>100 000), включая мониторинг, тюнинг, интеграции, troubleshooting, планирование и оптимизация нагрузки.
  • Практический опыт управления изменениями в продуктиве, проведение работ в согласованные окна, контроль влияния и пост-проверки.
  • Опыт применения Python, Bash для интеграций.
  • Опыт сервис-менеджмента в enterprise-среде (желательно в ИБ/ИТ решениях): управление ожиданиями клиента, планирование работ, контроль качества сервиса, проведение регулярных сервис-ревью.
  • Сильные customer-facing навыки: уверенное общение с техническими командами и руководителями уровня C−level, качественная устная/письменная коммуникация, презентации, протоколы встреч, официальная переписка.
  • Навык кросс-функционального взаимодействия: выстраивать работу «в одной связке» с разработкой, продуктовой командой, SOC, технической поддержкой, Professional Services, интегратором в рамках субподряда.
  • Умение проектировать и описывать архитектуру: структурировать требования, фиксировать решения, делать понятные схемы/диаграммы (логическая/физическая архитектура, потоки данных, интеграции).
  • Проактивность и ответственность за результат: видеть риски заранее, предлагать варианты, доводить задачи до завершения, сохранять управляемость в стрессовых ситуациях (инциденты/сбои/изменения).
  • Готовность 2–3 дня в неделю работать на площадке клиента в Москве для встреч и совместной проработки задач.
  • Навыки системного анализа: декомпозиция систем, комплексных проблем, требований, проведение RCA (root cause analysis) по проблемам.