Senior Data Engineer

Дата размещения вакансии: 12.03.2025

Работодатель: СБЕР

Уровень зарплаты:

з/п не указана

Город:

Москва

Требуемый опыт работы:

От 3 до 6 лет

Вы можете присоединиться к команде, которая занимается генеративной аналитикой и исследованиями того, как лучше решать существующие задачи с помощью RAG.
Вы будете: заниматься поиском и внедрением передовых подходов к работе с данными с использованием ИИ. Исследовать, как применение передовых фреймворков для работы с RAG и LLM в целом влияет на результат. Создавать и поддерживать эффективные ETL-пайплайны, чтобы поставлять в систему свежие данные для работы с ними с помощью RAG. Предлагать улучшения и варианты оптимизации существующей инфраструктуры, чтобы работать еще быстрее и с бóльшим количеством данных.

Задачи:

разработка и настройка механизмов для автоматизированного сбора данных, обеспечение корректности и полноты сбора, оптимизация процессов таким образом, чтобы все работало быстрее и без ручного вмешательства.
разработка пайплайнов для предобработки данных и их преобразования в формат, оптимальный для дальнейшего хранения, обработки и использования для RAG.
проектирование и реализация хранилища, которое позволило бы эффективно решать задачи, связанные с RAG.
применение машинного обучения и искусственного интеллекта для улучшения результатов работы.
поддержка корректной работы системы – мониторинг, диагностика и устранение неполадок, исправление старых багов и создание новых

Ожидания:

умение проектировать DWH, Data Lake, Data Management Platform
опыт построения и развития высоконагруженных систем
опыт разработки и оптимизации пайплайнов (batch, streaming) для обработки больших объемов данных (100TB - 1PB+)
продвинутый уровень владения Python и SQL
опыт работы с движками для распределенной обработки данных (Spark, Trino)
опыт работы с очередями сообщений (Kafka, RabbitMQ)
опыт работы с MPP базами данных и понимание их внутреннего устройства (ClickHouse, Greenplum, Vertica)
базовые навыки DevOps (Docker, Kubernetes, Ansible, Terraform, CI/CD

Будет плюсом:

опыт работы с облачными платформами (AWS, GCP, SberCloud) и хранилищами (S3, MinIO, Ceph)
опыт backend-разработки
опыт администрирования БД
опыт разработки на GoLang

Условия:

гибкий стек инструментов и технологий – можно пробовать новое, если точно знаете, зачем
адекватный подход к управлению – мы не ставим нереальных сроков и не предлагаем поработать в выходной ради высшего блага
работа с крупнейшими массивами данных на рынке России
гибкий график для оптимального баланса работы и личной жизни, возможна удалёнка
дружный коллектив и здоровая атмосфера взаимопомощи
амбициозные задачи
профессиональное обучение, семинары, тренинги, конференции, корпоративная библиотека
ДМС, страхование жизни
Свободный дресс-код.
Льготные кредиты и корпоративные скидки

Откликнуться

Senior Data Engineer

Похожие вакансии: Москва