Технический менеджер проектов в области хранения и обработки данных

Дата размещения вакансии: 13.09.2024
Работодатель: Яндекс
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Яндекс — одна из немногих компаний в мире, оперирующих экзабайтами данных, которые нужно уметь эффективно хранить, обрабатывать и передавать между различными системами. Для решения этих задач мы создали и развиваем распределённую платформу хранения и обработки данных YTsaurus. Недавно мы выложили код платформы в открытый доступ. Практически каждый сервис Яндекса использует её для хранения и обработки данных.

Одной из важных частей YTsaurus является SPYT — Apache Spark в качестве compute-движка поверх данных в YTsaurus. SPYT активно используют внешние и внутренние сервисы (например, для запуска ETL-процессов и ad-hoc аналитики).

Отличительная особенность SPYT — глубокая интеграция между Apache Spark и YTsaurus, которая позволяет учитывать метаданные для эффективной обработки. Так, SPYT поддерживает транзакции YTsaurus и применяет знание о сортировке таблиц для исключения shuffle-фазы при выполнении операции JOIN. Помимо этого SPYT использует YTsaurus в качестве среды исполнения для запуска кластеров Spark в облачной манере, благодаря чему в YTsaurus одновременно могут работать десятки кластеров SPYT.

Мы ищем технического менеджера проектов, который поможет нам развивать SPYT и будет заниматься сложными и амбициозными задачами. Примеры вызовов, которые стоят перед нами:

  • сделать SPYT инструментом номер один для ETL- и ELT-процессов поверх YTsaurus;
  • выстроить процесс поддержки и обмена опытом пользователей SPYT внутри Яндекса;
  • исследовать современные практики использования Apache Spark on-premise и в облаках и применять их в SPYT.

Мы — команда увлечённых людей, любим вызовы и готовы делиться знаниями. Приходите, если вам интересно развивать высоконагруженный инфраструктурный сервис и популяризовать YTsaurus как опенсорс-продукт.

Какие задачи вас ждут

  • вести внутренние инфраструктурные проекты, а в перспективе отвечать за один из ключевых для компании инфраструктурных сервисов;
  • участвовать в интеграционных проектах вместе с несколькими командами разработки, эксплуатации и тестирования;
  • общаться с внутренними пользователями и участвовать в формировании лучших практик использования инфраструктуры;
  • управлять процессом разработки и отвечать за его соответствие планам и требованиям;
  • критически анализировать рабочие процессы, находить проблемные места, предлагать и внедрять улучшения;
  • плодотворно сотрудничать с разработчиками и пользователями инфраструктуры.

Мы ждем, что вы

  • имеете опыт управления проектами и продуктами;
  • имеете опыт работы с командой разработчиков;
  • непосредственно разрабатывали программное обеспечение;
  • умеете расставлять приоритеты и решать задачи в срок;
  • умеете управлять обсуждениями и фиксировать результаты;
  • умеете составлять FAQ и пользовательскую документацию;
  • точно и внятно выражаете свои мысли устно и письменно, разговариваете с разработчиками на одном языке;
  • коммуникабельны;
  • имеете техническое или математическое высшее образование;
  • хотите стать экспертом в области инфраструктуры распределённых систем;
  • последний год работали в аналогичной должности.

Будет плюсом, если вы

  • понимаете основные принципы построения распределённых систем хранения и обработки данных;
  • работали с Hadoop, Spark или другими распределёнными системами хранения и обработки данных;
  • пишете на Python или любом другом языке программирования;
  • умеете писать SQL-запросы.