Автоматическое создание и разметка RGB-D изображений для обучения систем машинного зрения
Аннотация:
В связи с активным развитием технологий искусственного интеллекта, машинного зрения и глубокого обучения, а также появлением RGB-D камер, позволяющих получить объемное изображение сцены, все большее внимание уделяется различным задачам обработки трехмерных данных. Одной из таких задач является задача сегментации облака точек, которая находит применение в различных областях, от робототехники до архитектуры и решается методами машинного зрения. Для обучения систем машинного зрения требуется создание и аннотирование датасетов, которое занимает значительную часть времени проектирования и разработки. В данной работе предлагается автоматизировать процесс создания датасета с помощью компьютерных систем интерпретатора сценариев и реалистичного рендеринга, которые могут существенно сократить время, необходимое для создания датасета. Приводится пример создания датасета, обучения нейронной сети на этом наборе данных и использование сети, обученной на этом наборе данных, для классификации объектов на изображении сцены.