Middle Machine Learning Engineer
Прямой работодатель Phygital+ ( phygital.plus )
Опыт работы от 1 года до 3х лет
Мы ищем ML специалиста, с богатым опытом production-разработки и желанием работать в области исследований и разработок (R&D), чтобы стать частью проекта, который мы ведем уже более года
Основной задачей проекта является анализ облаков точек, полученных с помощью LiDAR-камер, в который входят задачи, такие как:
- обработка облаков точек
- извлечение объектов из облаков точек, принадлежащих конкретному классу (детекция, сегментация)
- оценка размеров извлеченных объектов
- оценка дефектов извлеченных объектов
Наша команда разрабатывает полноценный сервис для решения подобных задач, в которых применяются как классические алгоритмы машинного обучения, так и самые современные подходы глубокого обучения
Мы развиваем культуру исследовательской лаборатории, где уделяем большое количество времени на исследования современных подходов для создания новых и уникальных решений в работе с неевклидовым данными и не только, и надеемся, что кандидат также вдохновится и полюбит нашу работу. Для нас главное – это смотреть в одном направлении и представлять технологическое будущее
Что делать:
- Изучать state-of-the-art статьи, проекты, библиотеки и отдельные алгоритмы в области 3D ML, выделять рабочие и перспективные подходы, экспериментировать с ними
- Разрабатывать алгоритмы для обработки и анализа 3D данных: фильтрация, кластеризация, сегментация, восстановление поверхности из облака точек, анализ пространственных характеристик объекта и т.д.; а также придумывать и реализовывать собственные алгоритмы для решения нестандартных задач. Предстоит работать как с реальными данными, так и синтетическими
- Интегрировать реализованные алгоритмы в существующий пайплайн сервиса
Подробнее ознакомиться с 3DML: дадим информацию отдельно каждому кандидату
Требования:
- Опыт работы в области DL не менее 2 лет, опыт работы с 3D данными (меш, облако точек)
- Уверенное владение Python 3 и PyTorch
- Опыт работы с Linux, Docker, Git
- Опыт работы с Kubernetes (написание и запуск deployments)
- Опыт работы с RabbitMQ, MinIO, PostgreSQL
- Умение настроить весь цикл от предобработки данных до тестирования алгоритма/ модели и интеграции в продакшн
- Базовая алгоритмическая подготовка в области информатики
- Технический английский (чтение документации/ статей на уровне не ниже Intermediate)
Будет плюсом:
- Опыт работы на проекте, в котором присутствовал анализ 3D данных
- Опыт работы с библиотеками анализа 3D данных (PCL, Open3D и прочее)
- Опыт работы с PyTorch 3D/Geometric, PyTorch Lightning, TensorFlow
- Знание основ C/C++
- Опыт работы с DVC (data version control) или другой аналогичной системой
- Опыт работы с инструментами отслеживания экспериментов и их воспроизводимостью (ClearML, Weights & Biases, Tensorboard и т.д.)
- Умение писать многопоточный код
- Наличие профильного математического образования
- Наличие дополнительного профильного образования (ШАД Яндекса, Академии больших данных MADE, Ozon Masters и т. п.)
- Наличие призовых мест в соревнованиях на Kaggle.
- Любые другие знания и опыт работы в области 3D и 2D
- Наличие статей по теме математического моделирования, машинного обучения, 3D графике
Условия обсуждаем с каждым кандидатом отдельно. Если вам интересно, то присылайте небольшой рассказ о себе и своем опыте на почту. Мы будем рады, если у вас есть портфолио опубликованных проектов.