Middle Data Scientist

Дата размещения вакансии: 27.06.2024
Работодатель: Центр финансовых технологий
Уровень зарплаты:
з/п не указана
Город:
Санкт-Петербург
Требуемый опыт работы:
От 1 года до 3 лет

Мы, отдел исследований и разработки приложения Золотая Корона предлагаем присоединиться к команде разработки Антифрод-системы, которая помогает сохранить деньги жертв «колл-центров» и настоящих хакеров. Мы приветствуем инициативность и нестандартные подходы достижения целей, поэтому среди обычных задач скоринга появляются и задачи на NLP, на анализ «кликстрима» и т.д. Хоть и большую часть
времени занимает ресёрч для ML, мы так же не забываем о совершенствовании технической базы и процессов, развитие в смежные области (разработка, дата инженерия, девопс и т.д.) только приветствуется.

Обязанности:

1) Генерировать гипотезы по новым источникам данных, фичам, моделям и подходам к их обучению
2) Общаться с бизнесом, перерабатывать их хотелки в термины МЛ
3) Менторить джунов
4) Тестировать гипотез (что-то можно отдавать джунам, но нужно следить, чтобы у них было что-
то помимо рутины)
4.1) Подготавливать данные
4.2) Генерировать признаки
4.3) Обучать модели
4.4) Пилить из пунктов 4.1−4.3 промышленный пайплайн обработки данных.
5) Объяснять бизнесу результаты работ. Пример: объяснить бизнесу что такое ROC-кривая, и
заставить ткнуть в удовлетворяющую их точку.
6) Заниматься техническим совершенствованием. Например, выделить какой-нибудь
переиспользуемый кусок в библиотеку.
*) Обязанности стоит расценивать, скорее, как возможности, не факт, что придётся заниматься
всем и сразу. Например, если вы терпеть не можете общаться с бизнесом, но являетесь крутым
технарём или ментором, то можно минимизировать общение с бизнесом.

Требования:

1) Опыт работы с DS/ML от 1−3 года
2) Умение генерировать гипотезы, и составлять план их быстрой проверки
3) Знание классических алгоритмов МО: деревянные бустинги, кластеризация, понижение
размерности и т.д. Хорошее знание теории.
4) Продвинутое знание Python и какой-нибудь библиотеки верчения-кручения данных: pandas,
dask, pyspark, …
5) Базовые знания нейронок: как обучаются, популярные архитектуры, какие слои зачем нужны и
т.д.
6) Понимание зачем и как строить пайплайны обработки данных для обучения моделей.
7) Разработка на Python. Нужно уметь запихнуть свою модель в сервис, и написать DockerFile.
Просто кинуть бинарём в разработчиков не получится. aiohttp + плюшки в виде трассировки,
логгирования, метрик.
Будет плюсом:
1) Опыт DevOps: k8s/helm/gitlab-ci
2) Опыт с MLOps: AirFlow или KubeFlow или MLFlow
3) Работа в финтехе

Условия:

Аккредитованная IT компания;

Формат работы на выбор — офис, гибрид, удаленка;

Добровольное медицинское страхование;

Внутреннее и внешнее обучение;

Компенсация участия в топовых конференциях;

Работа в международной компании с 20 млн активных установок приложения Korona.

Похожие вакансии: Санкт-Петербург