Data Scientist

Дата размещения вакансии: 25.03.2025
Работодатель: Робот Мия
Уровень зарплаты:
от 150000 RUR
Город:
Новосибирск
Советский район, микрорайон Академгородок, Разъездная улица 12
Требуемый опыт работы:
От 1 года до 3 лет

Привет!
Robotmia -
продуктовая ИТ-компания. С 2017 года мы специализируемся на технологиях машинного обучения, искусственного интеллекта, и понимании естественного языка. Работаем с крупными российскими компаниями из самых разных сфер (медицина, логистика, банковский сектор и др.)

Мы ищем талантливого и увлеченного Data Scientist, который будет заниматься исследовательской деятельностью, анализом данных и разработкой инновационных решений в области машинного обучения. Если ты любишь исследовать данные, находить скрытые закономерности и создавать модели, которые решают сложные задачи, то эта вакансия для тебя!

Чем предстоит заниматься:

- Проведение исследовательского анализа данных (EDA) для выявления закономерностей, трендов и аномалий.

- Постановка гипотез и задач на основе анализа данных и бизнес требований.

- Исследование и анализ аудиоданных визуализация и предобработка.

- Разработка и обучение моделей для классификации аудио (например, распознавание речи, классификация звуков, идентификация голосов).

- Создание и оптимизация моделей для коррекции аудио (шумоподавление, улучшение качества звука, разделение источников звука).

- Исследование и применение современных архитектур нейронных сетей для работы с аудиоданными (CNN, RNN, LSTM, Transformer, WaveNet и др.).

- Проведение экспериментов с различными подходами к обработке звука, включая временные и частотные методы.

- Интеграция обученных моделей в production-среду и их дообучение на новых данных.

- Анализ результатов работы моделей, интерпретация данных и подготовка отчетов.

- Постоянное изучение новых методов и технологий в области обработки аудиоданных и машинного обучения.

Мы ожидаем от тебя:

- Опыт работы в области Data Science или Machine Learning от 3 лет.

- Глубокое понимание основных алгоритмов машинного обучения и нейронных сетей.

- Опыт работы с библиотеками для анализа данных и машинного обучения: Pandas, NumPy, Scikit-learn, TensorFlow, PyTorch.

- Навыки программирования на Python.

- Знание библиотек для работы с аудиоданными (Librosa, PyAudio, torchaudio).

- Умение выбирать и настраивать архитектуры нейронных сетей для задач классификации и коррекции аудио (CNN, RNN, LSTM, Transformer и др.).

- Навыки работы с инструментами для CI/CD (например, Git, Docker, Kubernetes)

- Умение работать в команде и самостоятельно решать сложные задачи.

- Умение доводить задачи от постановки гипотезы до внедрения и сопровождения, включая работу с production-средой.

Будет плюсом:

- Опыт работы с моделями для обработки аудио, такими как WaveNet, Tacotron, Speech2Text, Voice Conversion.

- Знание методов шумоподавления, разделения источников звука (Source Separation) и улучшения качества аудио.

- Опыт работы с потоковыми данными и реальными production-системами.

- Участие в Kaggle-соревнованиях или наличие публичных проектов на GitHub.

- Знание методов оптимизации моделей (квантзация, pruning, дистилляция).

- Опыт работы с инструментами для управления ML-экспериментами (ClearML, MLflow, Weights & Biases).

Мы предлагаем:

  • Стабильную зарплату 2 раза в месяц, отпуска и больничные;

  • Креативную команду, которая решает инновационные задачи;

  • Удобный офис в Академгородке (2 мин. от станции Сеятель), возможный гибридный формат работы.

Мы не корпорация, наша стратегия основана на доверии и долгосрочных отношениях. Нам важно, чтобы новый человек был ответственным, вовлеченным и не боялся сложных задач.