Москва
Сегодня билайн — компания изменений, чутко реагирующая на потребности рынка и людей. А ещё билайн — это команда, объединённая общими ценностями и общей целью — быть лидером телеком и digital рынков, предоставляя нашим клиентам новейшие продукты и услуги, а также сервис самого высокого уровня.
Сейчас у вас есть возможность присоединиться к лучшей команде по развитию антифрод продуктов в качестве Data-аналитика.
Чем предстоит заниматься:
- Формировать выгрузки с помощью SQL-запросов, Python и Pyspark (основная часть данных лежит в Hadoop, но иногда приходится “заглядывать” в Postgres или S3).
- Работать с большими табличными и текстовыми данными.
- Строить графики (lineplot, scatterplot, hist), проводить тесты и подсчеты метрик для подтверждения ваших идей.
- Заниматься формированием, дизайном и анализом экспериментов, измерять эффект от внедряемых изменений.
- Проводить R&D для помощи датасаентистам в проверке продуктовых гипотез или улучшении существующих моделей при помощи продвинутых методов анализа (математической статистики, визуализации).
Вот некоторые примеры конкретных задач, которые предстоит решать:
- Выяснить причину резкого падения/увеличения нежелательного трафика трафика с ХХ.ХХ.ХХХХ (сезонность? ошибка расчетов? появился новый крупный спамер? релиз другой команды в своем продукте?).
- Проанализировать причины оттока абонентов с услуги в зависимости от количества посланных им нотификаций.
- Провести анализ влияния “этикеток” на поведение звонящих номеров и номеров, которым они звонят.
- Написать прототип витрины для сбора подозрительных номеров или новых фичей.
- Проработать механизм сбора и обработки обратной связи (мнения) абонентов, получивших подозрительный вызов.
- Провести ревью существующих продуктовых дэшбордов, проверить, что они согласуются друг с другом, выглядят разумно (согласно нашим представлениям), предложить дополнительные графики.
Мы будем рады рассмотреть вашу кандидатуру, если у вас есть:
- Коммерческий опыт в аналитике данных от 3-х лет.
- Продвинутый уровень владения SQL (виды джойнов, подзапросы, аналитические функции, оптимизация запросов, оконные функции) для работы с большими таблицами (от сотен миллионов до миллиардов записей).
- Умение и готовность разбираться в большом объеме информации, разных атрибутах, таблицах, базах данных и их особенностях. Умение достать нужные данные из разных систем под конкретную задачу, разобравшись во всех нюансах.
- Умение пристально глядеть в данные и искать у себя и других ошибки и несостыковки в выводах, логике, цифрах.
- Уверенное знание Python для анализа данных и визуализации (pandas, matplotlib, scipy).
- Уверенное знание теории вероятностей и математической статистики, понимание основ статистического тестирования.
Будет плюсом:
- Владение инструментами Hadoop (PySpark, Hive). У нас огромный кластер на 30 ПБ и без инструментов BigData в билайне просто не выжить.
- Знание основ классического машинного обучения для табличных данных (понимание базовых алгоритмов кластеризации, деревьев решений, линейной регрессии, умение интерпретировать результаты). Чтобы быть на одной волне с датасаентистами.
- Опыт с Airflow, MLflow, Gitlab или аналоги.
Что мы предлагаем:
- Трудоустройство в аккредитованную ИТ-компанию.
- Возможность работать дистанционно на территории РФ.
- Сплоченную команду профессионалов, в которой можно не только успешно реализовывать проекты, но и перенимать опыт и развиваться.
- Обучение, участие в интересных проектах и расширение профессиональной экспертизы: мы участвуем в конференциях, митапах, публикуемся на Хабр и т.д.
- Конструктивную и открытую рабочую атмосферу.
- Полис добровольного медицинского страхования, обслуживаемый в лучших клиниках.
- Корпоративные скидки на фитнес, обучение, путешествия и т.п.
- Служебную сотовую связь.