Пресненская набережная
В команду аналитики в отдел ML-модерации ищем крутого специалиста, которому интересно работать на стыке ML и данных, пробовать новые алгоритмы обработки и исследования данных, а также выстраивать автоматизированые процессы, для упрощения жизни. Команда состоит из опытных и весёлых аналитиков данных, которые всегда готовы прийти на помощь в трудную минуту!
ML-модерация наполнена различными процессам обработки и проверки пользовательских данных, поэтому в нашу команду могут прилетать абсолютно разные задачи, связанные с анализом данных и моделей, исследованиями новых подходов к оценке качества существущих решений, разработкой новых продуктовых решений и многое другое!
Вы будете
- Оперировать с большими данными;
- Анализировать и проверять применимость различных решений;
- Оценивать и настраивать качество существующих моделей;
- Выстраивать пайплайны обработки данных;
- Экспериментировать с различными ML алгоритмами;
- Строить крутые графики в различных разрезах.
Нам важно
- знание основных библиотек Python (в том числе регулярные выражения);
- знание теории вероятностей и математической статистики;
- понимание устройства DWH системы;
- умение работать с hdfs и pyspark;
- знание SQL (диалекты clickhouse, vertica), умение оптимизировать запросы;
- понимание и использование ML-алгоритмов для анализа данных.
Будет плюсом
- опыт работы с Grafana;
- опыт работы с Superset;
- опыт работы с AirFlow;
- опыт работы с запросами http/gRPS, в том числе через Swagger;
- опыт работы с CI CD пайплайнами в gitlab;
- опыт работы с NVIDIA Triton Inference Server и Docker.