Middle Data Scientist

Дата размещения вакансии: 06.12.2024
Работодатель: Циан
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Циан — публичная IT-компания, крупнейший в России сервис для поиска недвижимости, входит в мировой топ-10.

Больше 20 лет мы помогаем быстрее решать вопросы с жилой и коммерческой недвижимостью: найти, оценить, купить, снять, продать, сдать и оформить сделку без рисков. Мы делаем сервисы, которые помогают владельцам недвижимости, застройщикам, агентам и обычным людям оптимизировать рутину поиска и продаж.

cian.ru — это большой и сложный продукт, в котором представлено несколько типов недвижимости и типов сделки, а также есть множество сервисов, информационных материалов и собственное медиа.

Ежемесячная аудитория около 18,7 млн. человек. Растить число пользователей и решать их проблемы помогают уже больше 1000 человек.

О команде:

В Циан большая команда ML - DS, DE, своя MLOps-платформа.

Команда разделена на продуктовые стримы. Мы формируем самодостаточные команды (разработчики, аналитики, ML-инженеры) для решения задач бизнес-направления. С процессами интеграции моделей в продакшн нам помогает команда MLOps-платформы. В команде настроены процессы перфоманс ревью, регулярного обмена опытом, выделяем время на исследовательскую работу.

Мы ищем Middle Data Scientist в команду Вторичка. Команда создает продукты для направления вторички. Большим core-функционалом команды является модель поиска дублей объявлений, на основе которых мы строим другие продукты для отделов продаж, модерации, сайта и тд.

Стек:

  • Пишем преимущественно на Python (Numpy, SciPy, Pandas, sklearn, PyTorch).

  • Активно используем экосистему Hadoop (PySpark, Hive, Kafka), у нас свой большой кластер

  • Для автоматизации запусков наших пайплайнов используем Airflow

  • Для технических метрик — Grafana, для бизнес-метрик — Superset/FineBI.

Основные задачи, которые нужно будет решать:

  • Предсказание оттока клиентов;

  • Развитие модели поиска дубликатов объявлениий;

  • Предсказание охвата объявлений;

  • Разработка и внедрение в продакшн моделей машинного обучения;

  • Участие во внутрикомандных процессах;

  • Коммуникация с продуктовыми заказчиками, а также с техническими командами;

Требования к кандидату:

  • Образование: МФТИ, МГУ (желательно Мехмат, ВМК), ВШЭ, ИТМО, Бауманка, НГУ и др.

  • Python: пишет легко читаемый и поддерживаемый код;

  • SQL: продвинутый уровень – оконные функции, оптимизация запросов;

  • Apache стек: HDFS / Kafka / Spark;

  • ML: классический - бустинги, линейные модели;

  • Базовые знания в NLP: трансформеры, tf-idf;

  • Базовые знания CV: классификация, детекция, сегментация;

  • DL: PyTorch / TensorFlow;

Что мы предлагаем:

  • Удаленную работу с возможностью приходить в офис в Москве, Санкт-Петербурге и Новосибирске. В офисе – кухни, оборудованные всем необходимым, а также снеки, фрукты, кофе и чай, бесплатная авто и вело парковки;

  • Технический рост. У нас есть успешные примеры роста с точки зрения ML, а также инженерии (разработка, архитектура приложений и сервисов) : есть возможность консультироваться с командой и брать инициативу по реализации крупных и сложных проектов.

  • Рост и развитие: в первые месяцы у каждого сотрудника есть ментор, после появляется личный план развития и возможность прокачивать soft/ hard skills на практике, обучении, конференциях;

  • ДМС с первого рабочего дня (со стоматологией, госпитализацией, страховкой выезжающего за пределы нашей страны);

  • 5 day off в год, помимо основного отпуска;

  • Кафетерий льгот Benefactory;