Data Engineer (Python/Django/ML)

Дата размещения вакансии: 13.04.2026
Работодатель: Hello, Doc!
Уровень зарплаты:
з/п не указана
Город:
Москва
проспект Мира 102с31
Требуемый опыт работы:
От 3 до 6 лет

"Hello, Doc!" (hellodoc.app) — активно развивающаяся компания в сфере онлайн медицины. С начала 2019 года мы занимаемся развитием мобильных приложений для врачей и пациентов, чтобы сделать их общение эффективным и удобным, а доступ к медицинским услугам доступным и понятным. Сегодня это уже более 400 000 пациентов и более 30 000 профи.

Мы ищем активного, целеустремлённого разработчика, который хочет расти и развивать online медицину вмести с нами.

Обязанности:

  • Построение и оптимизация Data Pipeline:
  • Проектирование и поддержка ETL/ELT-процессов в Yandex Cloud (Airflow, S3).
  • Организация хранения данных: работа с PostgreSQL (операционные данные) и ClickHouse (аналитика, большие объёмы результатов).
  • Автоматизация загрузки, очистки и нормализации разрозненных данных от партнёров и лабораторий — снижение доли ручной обработки с текущих 95%.
  • Обеспечение целостности и консистентности данных при масштабировании (новые регионы, препараты, позиции).
  • Работа с внешними данными и справочниками:

Сбор данных из внешних источников: парсинг, фильтрация, валидация, обновление и хранение.

Интеграция и поддержка актуальности внешних медицинских справочников: МКБ, справочники Минздрава, базы лабораторных исследований, реестры препаратов.

Создание и поддержка маппинга между внутренними данными и внешними стандартами (18 000+ тестов и позиций).

Мониторинг изменений во внешних источниках и своевременное обновление локальных витрин.

  • Разработка логики и инструментов для продукта (MedTech):

Структурирование медицинских данных для использования в продукте: связи «отклонение → рекомендация», «жалоба → чек-ап».

Разработка внутренних инструментов на Django (Admin/Interface), позволяющих врачам и экспертам самостоятельно управлять правилами, справочниками и данными — без участия разработчиков.

Реализация бизнес-логики для системы рекомендаций: автоматическое сопоставление результатов анализов с требованиями Минздрава и клиническими протоколами.

Автоматизация формирования заказов и чекапов на основе выявленных закономерностей и правил.

  • Поддержка ML и аналитики:

Подготовка и витринизация данных для ML-моделей, экспертных систем и отчётности.

Взаимодействие с командой ML и предметными экспертами (врачами) для перевода бизнес-требований в технические спецификации.

Участие в разработке гибридных систем: экспертные правила + LLM/GPT (управление контекстом, подготовка базы знаний, контроль качества генерации).

  • Архитектура и процессы:

Переход от «файликов сопоставления» к централизованной, документированной логической модели данных.

Самостоятельная проработка задач: трансформация размытых бизнес-пожеланий в конкретные, измеримые технические решения.

Оптимизация запросов и затрат на инфраструктуру в Yandex Cloud.

Документирование пайплайнов, справочников и бизнес-правил для передачи знаний внутри команды.

Требования:

  • Hard Skills:

Уверенное знание Python (на уровне написания сложных скриптов, сервисов и фоновых задач).

  • Опыт работы с Django (написание ад-панелей, CRUD-интерфейсов для внутренних инструментов).
  • Глубокое знание SQL, опыт работы с PostgreSQL и колоночными БД (ClickHouse).
  • Опыт оркестрации пайплайнов (Airflow).
  • Опыт работы с облачными хранилищами (S3, предпочтительно Yandex Cloud).
  • Понимание принципов построения DWH/Data Lake и витрин данных.

Опыт и компетенции:

  • Опыт работы в команде с ML-инженерами/дата-сайентистами (понимание жизненного цикла модели, подготовка фичей, верификация данных).
  • Умение работать с неструктурированными или «грязными» данными, приводить их к единому стандарту.
  • Опыт разработки инструментов автоматизации для бизнес-пользователей (чтобы они могли менять настройки и правила самостоятельно).
  • Опыт работы с внешними источниками данных: парсинг, нормализация, поддержка актуальности.
  • Способность работать в условиях неопределённости (задачи часто формулируются общими пожеланиями, нужна самостоятельность и проактивность).

Будет плюсом:

  • Опыт в MedTech / HealthTech (понимание терминов: МКБ, МИС, лабораторные анализы, клинические протоколы).
  • Опыт внедрения правил бизнес-логики в код (Expert Systems, rule-based системы).
  • Навыки работы с LLM/API (интеграция GPT/YaGPT для обработки текстов, генерации рекомендаций, управления контекстом).
  • Опыт работы с медицинскими справочниками и нормативными источниками (Минздрав, ФФОМС, зарубежные базы).

Условия:

  • Что получите в работе:

Возможность построить data-инфраструктуру «с нуля» в растущем MedTech-продукте.

Реальное влияние на продукт: ваши решения напрямую ускорят работу врачей и повысят качество рекомендаций.

Работу с интересными задачами на стыке данных, медицины и AI.

Команду, которая ценит самостоятельность и нацелена на измеримый бизнес-результат.

  • Удалённая занятость.
  • График работы 5/2, с 10:00 до 19:00.