Аналитик данных (антифрод продукты)

Дата размещения вакансии: 10.11.2024
Работодатель: билайн
Уровень зарплаты:
з/п не указана
Город:
Москва
Требуемый опыт работы:
От 3 до 6 лет

Сегодня билайн — компания изменений, чутко реагирующая на потребности рынка и людей. А ещё билайн — это команда, объединённая общими ценностями и общей целью — быть лидером телеком и digital рынков, предоставляя нашим клиентам новейшие продукты и услуги, а также сервис самого высокого уровня.

Сейчас у вас есть возможность присоединиться к лучшей команде по развитию антифрод продуктов в качестве Data-аналитика.

Чем предстоит заниматься:

  • Формировать выгрузки с помощью SQL-запросов, Python и Pyspark (основная часть данных лежит в Hadoop, но иногда приходится “заглядывать” в Postgres или S3).
  • Работать с большими табличными и текстовыми данными.
  • Строить графики (lineplot, scatterplot, hist), проводить тесты и подсчеты метрик для подтверждения ваших идей.
  • Заниматься формированием, дизайном и анализом экспериментов, измерять эффект от внедряемых изменений.
  • Проводить R&D для помощи датасаентистам в проверке продуктовых гипотез или улучшении существующих моделей при помощи продвинутых методов анализа (математической статистики, визуализации).

Вот некоторые примеры конкретных задач, которые предстоит решать:

  • Выяснить причину резкого падения/увеличения нежелательного трафика трафика с ХХ.ХХ.ХХХХ (сезонность? ошибка расчетов? появился новый крупный спамер? релиз другой команды в своем продукте?).
  • Проанализировать причины оттока абонентов с услуги в зависимости от количества посланных им нотификаций.
  • Провести анализ влияния “этикеток” на поведение звонящих номеров и номеров, которым они звонят.
  • Написать прототип витрины для сбора подозрительных номеров или новых фичей.
  • Проработать механизм сбора и обработки обратной связи (мнения) абонентов, получивших подозрительный вызов.
  • Провести ревью существующих продуктовых дэшбордов, проверить, что они согласуются друг с другом, выглядят разумно (согласно нашим представлениям), предложить дополнительные графики.

Мы будем рады рассмотреть вашу кандидатуру, если у вас есть:

  • Коммерческий опыт в аналитике данных от 3-х лет.
  • Продвинутый уровень владения SQL (виды джойнов, подзапросы, аналитические функции, оптимизация запросов, оконные функции) для работы с большими таблицами (от сотен миллионов до миллиардов записей).
  • Умение и готовность разбираться в большом объеме информации, разных атрибутах, таблицах, базах данных и их особенностях. Умение достать нужные данные из разных систем под конкретную задачу, разобравшись во всех нюансах.
  • Умение пристально глядеть в данные и искать у себя и других ошибки и несостыковки в выводах, логике, цифрах.
  • Уверенное знание Python для анализа данных и визуализации (pandas, matplotlib, scipy).
  • Уверенное знание теории вероятностей и математической статистики, понимание основ статистического тестирования.

Будет плюсом:

  • Владение инструментами Hadoop (PySpark, Hive). У нас огромный кластер на 30 ПБ и без инструментов BigData в билайне просто не выжить.
  • Знание основ классического машинного обучения для табличных данных (понимание базовых алгоритмов кластеризации, деревьев решений, линейной регрессии, умение интерпретировать результаты). Чтобы быть на одной волне с датасаентистами.
  • Опыт с Airflow, MLflow, Gitlab или аналоги.

Что мы предлагаем:

  • Трудоустройство в аккредитованную ИТ-компанию.
  • Возможность работать дистанционно на территории РФ.
  • Сплоченную команду профессионалов, в которой можно не только успешно реализовывать проекты, но и перенимать опыт и развиваться.
  • Обучение, участие в интересных проектах и расширение профессиональной экспертизы: мы участвуем в конференциях, митапах, публикуемся на Хабр и т.д.
  • Конструктивную и открытую рабочую атмосферу.
  • Полис добровольного медицинского страхования, обслуживаемый в лучших клиниках.
  • Корпоративные скидки на фитнес, обучение, путешествия и т.п.
  • Служебную сотовую связь.