Советский район, микрорайон Академгородок, Разъездная улица 12
Привет!
Robotmia - продуктовая ИТ-компания. С 2017 года мы специализируемся на технологиях машинного обучения, искусственного интеллекта, и понимании естественного языка. Работаем с крупными российскими компаниями из самых разных сфер (медицина, логистика, банковский сектор и др.)
Мы ищем талантливого и увлеченного Data Scientist, который будет заниматься исследовательской деятельностью, анализом данных и разработкой инновационных решений в области машинного обучения. Если ты любишь исследовать данные, находить скрытые закономерности и создавать модели, которые решают сложные задачи, то эта вакансия для тебя!
Чем предстоит заниматься:
- Проведение исследовательского анализа данных (EDA) для выявления закономерностей, трендов и аномалий.
- Постановка гипотез и задач на основе анализа данных и бизнес требований.
- Исследование и анализ аудиоданных визуализация и предобработка.
- Разработка и обучение моделей для классификации аудио (например, распознавание речи, классификация звуков, идентификация голосов).
- Создание и оптимизация моделей для коррекции аудио (шумоподавление, улучшение качества звука, разделение источников звука).
- Исследование и применение современных архитектур нейронных сетей для работы с аудиоданными (CNN, RNN, LSTM, Transformer, WaveNet и др.).
- Проведение экспериментов с различными подходами к обработке звука, включая временные и частотные методы.
- Интеграция обученных моделей в production-среду и их дообучение на новых данных.
- Анализ результатов работы моделей, интерпретация данных и подготовка отчетов.
- Постоянное изучение новых методов и технологий в области обработки аудиоданных и машинного обучения.
Мы ожидаем от тебя:
- Опыт работы в области Data Science или Machine Learning от 3 лет.
- Глубокое понимание основных алгоритмов машинного обучения и нейронных сетей.
- Опыт работы с библиотеками для анализа данных и машинного обучения: Pandas, NumPy, Scikit-learn, TensorFlow, PyTorch.
- Навыки программирования на Python.
- Знание библиотек для работы с аудиоданными (Librosa, PyAudio, torchaudio).
- Умение выбирать и настраивать архитектуры нейронных сетей для задач классификации и коррекции аудио (CNN, RNN, LSTM, Transformer и др.).
- Навыки работы с инструментами для CI/CD (например, Git, Docker, Kubernetes)
- Умение работать в команде и самостоятельно решать сложные задачи.
- Умение доводить задачи от постановки гипотезы до внедрения и сопровождения, включая работу с production-средой.
Будет плюсом:
- Опыт работы с моделями для обработки аудио, такими как WaveNet, Tacotron, Speech2Text, Voice Conversion.
- Знание методов шумоподавления, разделения источников звука (Source Separation) и улучшения качества аудио.
- Опыт работы с потоковыми данными и реальными production-системами.
- Участие в Kaggle-соревнованиях или наличие публичных проектов на GitHub.
- Знание методов оптимизации моделей (квантзация, pruning, дистилляция).
- Опыт работы с инструментами для управления ML-экспериментами (ClearML, MLflow, Weights & Biases).
Мы предлагаем:
-
Стабильную зарплату 2 раза в месяц, отпуска и больничные;
-
Креативную команду, которая решает инновационные задачи;
-
Удобный офис в Академгородке (2 мин. от станции Сеятель), возможный гибридный формат работы.
Мы не корпорация, наша стратегия основана на доверии и долгосрочных отношениях. Нам важно, чтобы новый человек был ответственным, вовлеченным и не боялся сложных задач.