Москва
Щукинская улица 5с1
Щукинская улица 5с1
В связи с расширением отдела медицинской геномики мы ищем Data инженера. Мы активно занимается проектами, охватывающими такие важные области, как возраст-ассоциированные заболевания, кардиология, психиатрия, спорт. Вакансия предусматривает выполнение тестового задания.
В нашем распоряжении имеется одно из самых больших хранилищ генетических данных в мире (более 15 ПБ общего пространства и до 100 ТБ — боевые базы данных) и один из самых больших ЦОД для их непрерывного анализа и обработки.
Обязанности:
- Разработка баз данных (архитектура, метод хранения).
- Проектирование и разработка архитектуры DWH, определение модели данных, распределение слоев и создание витрин.
- Разработка и оптимизация методов доступа к базам данных и оптимизация скорости запросов.
- Разработка методов мониторинга и информирования пользователей о качестве данных и их составе.
- Разработка пайплайнов преобразования данных в рамках рутинных задач обработки.
Требования:
- SQL (Postgres, Clickhouse, Greenplum), MongoDB, Python 3.8+ (желателен уровень выше базового для решения задач частичной обработки данных).
- Опыт работы с Hadoop и Apache Spark, желательно Dask, bash.
- Опыт работы с Git.
- Знание архитектур DWH, опыт проектирования слоев данных и ETL-процессов.
- Желательно: опыт настройки конвейеров в GitLab CI/CD, контейнеризация приложений с использованием Docker и их оркестрация в Kubernetes.
Условия:
- Работа в быстрорастущей, стабильной организации, которой не страшен кризис.
- Гибридный график работы после прохождения испытательного срока.
- Стабильная заработная плата по рынку и выше (обсуждается на собеседовании).
- Оформление по ТК РФ.
- Прикрепление к поликлинике ФМБЦ им. Бурназяна ФМБА.
- Комфортный офис в 10 минутах от м. Щукинская.